Что можно оценивать с помощью метода тестирования. Реферат

Подписаться
Вступай в сообщество «passport13.com»!
ВКонтакте:

Контрольные испытания помогают: выявить уровень развития отдельных двигательных качеств; оценить степень технической и тактической подготовленности; сравнить подготовленность как отдельных занимающихся, так и целых групп; провести наиболее оптимальный отбор спортсменов для занятий тем или иным видом спорта и для участия в соревновании; вести в значительной степени объективный контроль за тренировками, как отдельных спортсменов, так и целых групп; выявлять преимущества и недостатки применяемых средств, методов обучения и форм организации занятий; составлять наиболее обоснованные индивидуальные и групповые планы занятий.

Контрольные испытания проводятся с помощью контрольных упражнений, или тестов. Определенная система использования контрольных упражнений называется тестированием.

Контрольные упражнения - это стандартизированные по содержанию, форме и условиям выполнения двигательные действия, применяемые с целью определения физического состояния занимающихся на данный период обучения. Контрольные упражнения могут применяться и как обычные физические упражнения.

В исследованиях, как правило, применяют не одно контрольное упражнение, а несколько. Например, при изучении специальной подготовленности спортсмена применяют тесты, характеризующие уровни развития специальных двигательных качеств, технической, тактической подготовленности и т. п.

При том, что контрольные упражнения помогают определить физическое состояние человека, его готовность к физическим упражнениям

Достоверность любых контрольных упражнений проверяется таким комплексным показателем подготовленности занимающихся, как оценочные результаты той деятельности, которая являлась предметом специальной подготовки (например, для выступления на соревнованиях).

Приступая к исследованию, следует предварительно разработать систему контрольных упражнений. Сложность разработки зависит от характера «основной» деятельности. Несколько проще создавать систему контрольных упражнений для видов спорта, в которых результаты оцениваются метрическими единицами, поскольку при наличии объективных единиц измерения можно использовать математические расчеты для установления избирательности и воспроизводимости контрольных упражнений.

Билет 17

Вопрос 1. Методы использования слова

С помощью слова учитель осуществляет многие функции, составляющие его конструктивную, организаторскую и другие стороны деятельности, а также устанавливает взаимоотношения с учениками, общается с ними. Слово активизирует весь процесс обучения, так как способствует формированию более полных и отчетливых представлений, помогает глубже осмыслить, активнее воспринять учебную задачу. Через слово ученик получает новые знания, понятия и их терминологическое определение, что во многом определяет его отношение к физическому воспитанию в целом и к изучаемому упражнению в частности. С помощью слова учитель анализирует и оценивает результаты освоения учебного материала и тем самым способствует развитию у ребенка самооценки. Наконец, без слова учитель был бы не в состоянии руководить всем процессом обучения и поведения учеников. Таким образом, учитель физического воспитания имеет возможность использовать две функции слова: смысловую, с помощью которой выражается содержание преподаваемого материала, и эмоциональную, позволяющую воздействовать на чувства ученика.

Грамотность употребления терминов обусловлена знанием некоторых общих требований к ним:

Термин должен быть показательным, т. е. отражающим основу техники физического упражнения. Тогда он приобретает только ему свойственное содержание. Показательность термина достигается двумя способами: чаще отражением в названии физического упражнения структуры действия (прыжок в высоту с разбега способом «перешагивание»).

Термин должен быть точным.

Термин должен быть понятным. Терминология становится языком обучения в том случае, если употребляемые слова-термины доступны пониманию учеников.

Термин должен быть кратким. Если нарушается это требование, то термин превращается в описание, а следовательно, теряет свое назначение.

Эмоциональная функция слова способствует решению и учебных, и воспитательных задач. Эмоциональность речи усиливает значение слов и помогает понять их смысл. Она показывает отношение учителя к предмету изучения, к самим ученикам, что, естественно, стимулирует их интерес, уверенность в своем успехе, желание преодолеть трудности и т. п.

Почти все разновидности методов использования слова являются общепедагогическими. Использование их в процессе физического воспитания отличается лишь содержанием и некоторыми особенностями методики применения.

Рассказ - повествовательная форма изложения - чаще всего применяется учителем при организации игровой деятельности учеников.

Описание - это способ создания у ребенка представления о действии. При описании дается перечень характерных признаков действия, говорится, что надо делать, но не указывается, почему надо так делать. Используется оно при создании первоначального представления или при изучении относительно простых действий, когда ученики могут использовать свои знания и двигательный опыт.

Объяснение является важнейшим способом развития сознательного отношения к действиям, так как призвано вскрывать основу техники, отвечать на главный вопрос: «Почему?»

Беседа помогает, с одной стороны, повысить активность, развить умение высказывать свои мысли, а с другой - узнать учителю своих учеников, оценить проделанную работу. Беседа может протекать в виде вопросов учителя и ответов учеников или в виде свободного выяснения взглядов. Вторая разновидность более активна, но доступна ученикам с высоким уровнем знаний и двигательного опыта.

Разбор отличается от беседы только тем, что проводится после выполнения какого-либо задания (например, игры). Разбор может быть односторонним, когда его проводит только учитель, или двусторонним - в виде беседы с участием учеников. Вторая форма позволяет решать образовательные и воспитательные задачи более эффективно.

Заданиепредусматривает постановку задачи перед уроком или частных задач по ходу урока. Первая форма задания характеризуется тем, что учитель объясняет все способы выполнения задачи, ученикам остается лишь выполнить требуемое. Вторая форма является более сложной для учеников, так как они получают от учителя лишь формулировку задачи, а способы ее решения вынуждены искать самостоятельно.

Указание (или распоряжение) отличается краткостью и требует безоговорочного исполнения. Это акцентирует внимание учеников на необходимости выполнения задачи и одновременно повышает уверенность в возможности ее выполнения. Через указания ученики получают точную ориентацию в способах решения задачи, в приемах исправления ошибки, но без обоснования.

Оценка является результатом анализа выполнения действия. Критерии оценки зависят от задач учебного процесса, а поэтому имеют несколько разновидностей:

· Оценка путем сравнения со стандартной техникой исполнения применяется, как правило, на начальных этапах обучения, когда возможности учеников ограничены способностью подражать образцу.

· Оценка путем сравнения с техникой исполнения другого ученика является своеобразной конкурсной оценкой. Она призвана стимулировать интерес ученика к упражнению, к систематическим занятиям, но часто не может служить показателем качества исполнения.

· Оценка путем определения результативности действия обладает, как правило, наибольшей дидактической ценностью. Она заставляет ученика сопоставлять технику своего исполнения с достигнутым результатом и искать способы ее индивидуализации.

· Категории оценки выражаются в различного рода замечаниях учителя, отражающих его одобрение или неодобрение: «хорошо», «правильно», «так», «плохо», «неправильно», «не так», а также в форме инструктивных указаний: «выше ноги», «не сгибать руки» и т. п.

· Подобные односложные замечания должны мотивироваться учителем. Правда, одобрение уже само по себе имеет положительное значение, так как подтверждает правильность действий ученика. Однако и в этом случае пояснение учителя, что именно заслуживает похвалы, будет иметь большое дидактическое значение, причем не только для выполнявшего упражнение, но и для наблюдавших за ним товарищей.

· Оценка учителя обязана быть средством воспитания в ученике уверенности в своих силах. Поэтому оцениваться должны успехи или неудачи в освоении учебного материала, отношение к работе, но ни в коем случае не личность ученика.

Команда - специфический и наиболее распространенный метод использования слова в физическом воспитании. Она имеет форму приказа к немедленному исполнению действия, к его окончанию или к изменению темпа движений. Применяются строевые команды, принятые в армии, и специальные - в виде судейских реплик, стартовых команд и т. п. При работе с детьми дошкольного возраста команда не применяется, а при работе с детьми младшего школьного возраста используется с ограничениями. На эффективность команды влияют: умение правильно и с необходимыми ударениями произносить слова, развитое чувство ритма речи и движений учеников, способность изменять силу и тон голоса, красивая осанка и умеренная жестикуляция, высокий уровень дисциплинированности учеников.

Подсчет позволяет задавать ученикам необходимый темп выполнения движений. Осуществляется он несколькими приемами: голосом с применением счета («раз-два-три-четыре!»), счетом в сочетании с односложными указаниями («раз-два-выдох-выдох!»), только односложными указаниями («вдох-вдох-выдох-выдох!») и, наконец, различными сочетаниями счета, постукивания, похлопывания и т. п.

В переводе с английского языка «тест» - испытание, проба, проверка. В психологии, социологии, педагогике и других науках о человеке это слово употребляется в качестве термина, обозначающего систему заданий, подобранных с таким расчетом, чтобы можно было точно и обоснованно охарактеризовать конкретные особенности лиц, выполнивших эти задания. Они конструируются, выверяются, используются и интерпретируются по строгим и независящим от специфики той или иной науки правилам, призванным обеспечить качество выводов.

Рассмотрим метод исследования, предусматривающий анализ деятельности испытуемых с такими заданиями. В психодиагностике под тестированием понимают стандартизированное испытание, предназначенное для установления количественных (и качественных) индивидуально-психологических различий. Подчеркивая точность вычисления результатов и максимальную изолированность их от влияния людей, организующих данную процедуру, о тестировании часто говорят как об «измерении» особенностей психики.

Следует заметить, что ключевое понятие в приведенном выше определении - стандартизированность. Что это такое?

Во-первых, это обозначение единообразия требований ко всем условиям тестирования и инструкциям по его проведению и обработке результатов. В отношении разных лиц тест применяется унифицированно, по одному и тому же стандарту. Тем самым обеспечивается определенная гарантия уравнивания ситуативных факторов, способных поставить часть испытуемых в более выгодное положение по сравнению с остальными. Без стандартизации становится невозможным сопоставление индивидуальных результатов.

Так, например, инструкции обычно предъявляются в письменном виде или (реже) зачитываются, но никак не формулируются по памяти, своими словами. После этого никому не дается персональных пояснений, индивидуальных комментариев и т. п.

Во-вторых, стандартизированностью называют перевод первичных («сырых») тестовых баллов, отражающих количество выполненных заданий, в более обобщенную шкалу, характеризующую степень индивидуальной выраженности данного психического свойства или функции.

Допустим, при выполнении теста интеллекта испытуемый успешно решил определенное количество заданий. Зная только это, мы не можем еще ничего сказать о том, каков уровень его интеллекта. В самом деле, много им сделано или мало? Хорошо прошло для него испытание или плохо? Часто ли такой показатель встречается у других? А сколько заданий следовало бы выполнить, чтобы засвидетельствовать высокий уровень интеллекта?

На все эти вопросы невозможно дать ответ, не имея единой для всех системы отсчета, некоего эталона. В качестве последнего обычно выступают итоги тестирования многочисленной и репрезентативной выборки. Сравнивая одного испытуемого с другими, делавшими ранее тот же тест, мы осуществляем стандартизацию по статистической норме. В последнее время все чаще применяется и несколько иной вид стандартизации, когда результаты испытуемого сопоставляют не с другими результатами, а с описанием требований общества к развитию данной функции или свойства, то есть с социально-психологическим нормативом. Как бы то ни было, стандартизация обеспечивает возможность перехода от сведений по выполнению конкретного теста тем или иным лицом к психологическим характеристикам, лежит в основе единообразия интерпретации.

Обратимся к истории начального этапа развития метода тестов.

Известно, что уже в глубокой древности существовали более или менее типовые процедуры выявления индивидуальных различий между людьми. Так, в Китае более четырех тысяч лет назад высшие чиновники обязаны были выдержать в присутствии императора строгий экзамен по знанию ритуалов и церемоний, стрельбе из лука, верховой езде, умению писать, считать, музицировать. В древнем Вавилоне и в Египте претендент на должность писца должен был доказать обладание соответствующими навыками, разбираться в финансах, законах, сельском хозяйстве. В библии описаны своеобразные способы отбора воинов на особо трудные и опасные задания в зависимости от их действий на привале. В античной Греции и Риме разрабатывались весьма подробные классификации характеров и закономерности их определения по поведенческим признакам...

Несмотря на то, что все это и многое другое исторически предшествовало тестированию, возникновение научных тестов следует отнести лишь к концу девятнадцатого века. Сам термин был введен создателем первых антропометрических тестов Френсисом Гальтоном (1822 -1911), занимавшимся исследованием остроты зрения и слуха, мускульной силы и т. п. Однако наибольшую популярность этот термин приобрел после выхода в свет в 1890 году статьи «Умственные тесты и измерения», написанной американским психологом, родоначальником современного тестирования Джеймсом Кеттеллом (1860-1944). В этой статье Кеттелл писал о том, что применение серии статистически обрабатываемых заданий к большому количеству индивидов как ничто другое способствует преобразованию психологии в точную науку. Им же впервые была высказана мысль о необходимости стандартизации ситуации обследования.

Кеттелл разработал несколько десятков тестов, направленных на оценку элементарных сенсомоторных процессов (чувствительности, времени реакции, количества воспроизводимых звуков после разового прослушивания и др.).

Довольно быстро возникла потребность в ориентации тестов на высшие психические функции. Качественный рывок в этом направлении связан с именем Альфреда Бине (1857-1911), составившего по поручению министерства образования Франции в 1905 году серию тестов интеллекта.

Тестирование по шкале Бине начиналось с предъявления заданий, соответствующих хронологическому возрасту ребенка (то есть тех, которые успешно решались подавляющим большинством его сверстников). Если он успешно справлялся с работой, предлагался материал, рассчитанный на более старших детей. В случае, если ребенок решал лишь часть новых заданий, испытание прекращалось. При этом к количеству лет базового умственного возраста (тому, где были все задания решены) прибавлялось несколько месяцев умственного возраста (пропорционально количеству решенных заданий для более старших). Если же ребенок не справлялся со всеми заданиями своей возрастной группы, ему давался материал для более младших, пока не доходили до возраста, все задания которого успешно решались.

По А. Бине, характеристикой интеллекта являлась разность между умственным и хронологическим возрастами. Однако, как легко заметить, одна и та же разность для той или иной возрастной ступени приобретает неодинаковое значение. Такое обстоятельство весьма неудобно. Для его устранения немецкий психолог Вильям Штерн (1875-1938) предложил в 1912 году определять не разность, а соотношение (частное) умственного и хронологического возрастов, то есть делить показатели один на другой. Полученное число, умноженное на 100, он назвал величиной коэффициента интеллекта (IQ).

Заметим, что в большинстве современных тестов интеллекта принята иная процедура определения коэффициента, предложенная американским психологом и психиатром Дэвидом Векслером (1896-1981). Она основана на применении единицы стандартных отклонений, показывающей, как соотносятся результаты испытуемого с интеллектом группы его сверстников.

Тесты, созданные в начале века, были индивидуальными. Использовать их могли лишь высококвалифицированные психологи. В период первой мировой войны в Америке возникла необходимость массовых обследований призывников на предмет оптимального распределения их с учетом индивидуальных особенностей. По поручению военного ведомства Артур Отис (1888-1963) разработал первые групповые тесты - «альфа» и «бета». Одна из форм предназначалась для определения интеллекта у лиц, хорошо знающих английский язык, а другая была ориентирована на малограмотных и иностранцев. Эти тесты были значительно упрощены по процедуре применения и оценке результатов.

С 20-х гг. началось широкое распространение тестирования во всем мире. При этом, наряду с тестами общего интеллекта, стало активно развиваться и более конкретное, приближенное к потребностям повседневной диагностической практики тестирование специальных способностей и профессиональных достижений. В 30-е - 40-е гг. происходит становление психодиагностики личности, осуществляемой при помощи тестов, опросников, проективных методик.

Именно тогда на несколько десятилетий были прекращены все психодиагностические исследования в СССР. Это стало следствием постановления ЦК ВКП(б), осудившего (1934 г.) существовавшую в то время педологию - науку о целостном изучении ребенка с помощью комплекса методов психологии, анатомии, физиологии, медицины и педагогики.

В настоящее время в нашей стране, как и во всем мире, тестирование является одним из основных методов психологического исследования. Динамично развивается его инструментарий, непрерывно совершенствуются способы обработки и интерпретации информации.

Одним из наиболее важных вопросов разработки теста следует признать необходимость тщательного выявления качества измерения. На последних страницах журналов иногда печатают так называемые «популярные тесты». В отечественной школе все чаще применяются «тесты учителей». В строгом смысле слова те и другие нельзя отнести к тестам, так как показатели их надежности и валидности не установлены.

Надежность - это помехоустойчивость теста, независимость его результатов от действия случайных факторов.

Можно ли в дальнейшем применять тест, если на этапе проверки его качества испытуемые каждый раз получают оценки, значительно расходящиеся с предыдущими своими оценками? Ведь если исследуемый признак по своей природе стабилен, то результаты повторных тестирований одних и тех же лиц должны быть сходными, почти не отличающимися от полученных ранее. Надежность является характеристикой точности измерения. Она позволяет судить о том, в какой мере можно доверять данным тестирования.

Причинами недостаточной надежности тестов являются:

  • - разнообразие ситуационных условий испытания, меняющихся от одного случая к другому (различия в манере поведения тестирующего лица, наличие посторонних помех, непредусмотренное присутствие других людей, вариативность освещенности помещения и температуры воздуха и т. д.);
  • - несовершенство разработанного теста (нечеткость инструкций, принципиальная разнородность заданий, допущение элементов субъективизма при интерпретации выполнений и т. д.);
  • - изменения внутренних состояний испытуемых (усталость, раздражение, апатия, нервозность и др.), а также их отношений к тестированию.

Максимальное устранение названных причин способствует достижению приемлемой надежности теста.

Количественным выражением данной характеристики служат коэффициенты надежности. Каждый из них освещает какую-либо сторону, определенный аспект точности измерения. Прежде чем мы перейдем к рассмотрению типов надежности, заметим, что процедура исчисления значений коэффициентов обычно предполагает установление корреляции рангов всех членов выборки, в отношении которых тест проверяется составителями перед внедрением его в психодиагностическую практику. В связи с тем, что корреляционный анализ в дальнейшем изучается как самостоятельный метод, укажем лишь одно: величина коэффициента надежности тем больше, чем неизменнее место (ранг) испытуемых по отношению ко всем другим рангам в выборке. Иначе говоря, положение результатов каждого испытуемого в общем ряду показателей выполнения теста должно всякий раз сохраняться.

На практике применяются чаще всего следующие типы данной характеристики теста:

1. Ретестовая надежность, определяемая при повторном обследовании тестом одних и тех же лиц.

Здесь есть одна проблема: если интервал времени между тестированиями небольшой, то заметно влияние эффекта тренировки, если же временной промежуток значителен, то за этот период вполне может измениться сам исследуемый признак. Тем не менее, ретестовая надежность является важной характеристикой, она позволяет установить степень независимости результатов тестирования от воздействий проводящих его людей, а также от возможных изменений ситуаций обследования.

Считается необходимым, чтобы коэффициент такой надежности был не ниже 0,80. В противном случае точность измерения недостаточна, процедура тестирования нуждается в дополнительной стандартизации.

2. Надежность частей теста, которая характеризует степень однородности (или, как говорят, гомогенности) всех его заданий. Это свидетельство, что разработанный тест отражает актуальное состояние только одного психического феномена, а все его задания взаимно согласованы, непротиворечивы и неразнонаправленны.

Чаще всего для применения этого способа задания делятся на четные и нечетные. Результаты выполнения людьми тех и других обрабатываются отдельно, а затем сопоставляются.

Тест считается надежным, если полученный при сопоставлении коэффициент превышает 0,75. В том случае, когда данный показатель не достигает указанной величины (а это не редкость при разработке теста), составителю необходимо выявить, какие именно задания следует переделать или изъять из употребления.

3. Надежность параллельных форм устанавливается, если составителем разработано несколько взаимозаменяемых наборов заданий, то есть тех, которые по своему содержанию являются весьма сходными, но не идентичными, напоминая варианты заданий школьной контрольной работы.

Принятая процедура определения такой надежности предусматривает, что выборка делится на две равные части, затем одной из них предлагается первая форма теста, а другой - вторая. Через некоторое время производится повторное тестирования, но в обратном порядке. Коэффициент надежности устанавливается методом корреляционного анализа результатов обоих тестирований. Его величина не должна быть менее 0,75. В противном случае становится необходимой проверка степени стандартизированности испытания и изменение содержания тех заданий, которые оказались несоответствующими своим аналогам из параллельной формы.

Итак, надежность теста характеризует степень точности измерения, не сообщая о том, что же именно измеряется. Она является предпосылкой наличия другого важного качества - валидности.

Валидность (от англ. «действительный», «пригодный», «имеющий силу») - комплексная характеристика теста, указывающая на обоснованность и эффективность его применения.

В классической тестологии выделяется множество типов валидности. Проанализируем наиболее распространенные из них.

Такая валидность имеет особое значение в критериально-ориентированных тестах (КОРТ) и тестах достижений, о которых речь пойдет ниже.

2. Конструктная валидность отражает степень соотнесения результатов теста с базовыми для него теоретическими понятиями (конструктами). Определяется, когда предмет измерения существует в неявном, комплексном виде, требует специального анализа.

Например, если тест разрабатывается для установления степени понимания речи, то необходимо, как минимум, представлять, какие компоненты образуют этот конструкт. Выберите из предложенного здесь перечня только те пункты, которые относятся к «пониманию речи»:

  • - ребенок может ответить на вопросы;
  • - он очень внимателен при слушании;
  • - он может пересказать услышанное своими словами;
  • - он может дословно запомнить текст с первого раза;
  • - он может составить план текста;
  • - он задает экспериментатору много вопросов по услышанному...

Очевидно, что только часть из них имеет отношение к рассматриваемому конструкту. Осуществив анализ проблемы, мы можем в дальнейшем составить задания, отражающие разные аспекты понимания речи.

После этого формулируется ряд гипотез о том, каким образом данные разрабатываемого теста будут коррелировать с широким кругом других тестов, направленных как на близкие конструкты, так и на отдаленные. Гипотезы проверяются методами корреляционного и факторного анализа. Подтверждение или опровержение совокупности теоретически ожидаемых связей становится характеристикой конструктной валидности теста.

  • 3. Критериальная валидность показывает, как результаты тестирования соотносятся с теми оценками измеряемого качества или свойства, которые получены другими (нетестовыми) способами, а именно: с мнениями специалистов, данными наблюдений и экспериментов, анализом продуктов деятельности испытуемых и т. д. Она может быть двух типов:
    • - валидностью текущей, когда результаты теста сопоставляются с данными из других источников, собираемых одновременно с тестированием;
    • - валидностью прогностической (предсказывающей), когда результаты теста сопоставляются с более поздним поведением испытуемого в данной сфере. К примеру, итоги тестирования учебных достижений в выпускном классе могут быть подтверждены, а могут быть и опровергнуты фактами о поступлении членов выборки в высшие учебные заведения.

Иногда применительно к некоторым из описанных типов валидности употребляют обозначение «эмпирическая валидность». Так называют те из них, при определении степени выраженности которых использовались статистические способы анализа данных, то есть коэффициенты вычислялись путем корреляций.

Каким образом соотносятся между собой характеристики эмпирической валидности и надежности?

Если высокая надежность теста свидетельствует, что он точно измеряет нечто, то высокая валидность указывает, что тест измеряет именно то, для чего он был разработан. Поэтому коэффициенты валидности не могут превышать значений коэффициентов надежности.

Обе рассмотренные характеристики непременно определяются составителями в ходе подготовки теста. Психолог, использующий тест в своей работе, благодаря этому получает представление о качестве измерения. Следует сказать и о том, что повторную проверку на надежность и валидность обычно проходят тесты, заимствованные, переведенные на другой язык. Без этого невозможно судить о качестве их социокультурной адаптации к новым условиям использования.

Бывает так, что тест обладает адекватной валидностью и надежностью, но тем не менее, почти не находит применения в исследовательской практике. Это может быть обусловлено излишней сложностью процедуры интерпретации, чрезмерно высокими требованиями к квалификации тестирующего, значительной трудоемкостью и длительностью применения и т. д. Необходимо считать существенной еще одну характеристику психологического измерения - его экономичность.

Под экономичностью понимают целесообразность применения теста, определяемую наличием допустимого соотношения затрат на тестирование (времени, труда, финансов) и пользы от него.

Сказанное, разумеется, не означает, что тестирование непременно должно быть легким, коротким и «дешевым», пусть даже в ущерб другим качествам измерения. Речь идет именно о допустимом соотношении надежности, валидности и экономичности.

Перейдем к изучению основных видов тестов. Для этого воспользуемся одной из наиболее распространенных классификаций. В зависимости от особенностей интерпретации выполнения тесты подразделяются на два вида:

  • - ориентированные на статистическую норму;
  • - критериально-ориентированные (КОРТ).

Первые из них предполагают использование традиционного приема математической статистики - «нормирования» результатов. Что это такое?

Процедура разработки такого теста обязательно предусматривает установление норм его выполнения путем предварительного тестирования репрезентативной выборки лиц, для которых он предназначен. При этом выявляется диапазон тестовых баллов, характерный для низкого уровня развития данного психического свойства или функции, среднего уровня и высокого. В дальнейшем результаты испытуемого сравнивают с данными, полученными при тестировании выборки, определяя тем самым относительное его место в общем ряду.

Следует заметить, что задания ориентированного на статистическую норму теста подбираются таким образом, чтобы итоги их выполнения выборкой приближались к кривой нормального распределения Гаусса.

Описание подобного распределения результатов может быть сделано с помощью двух показателей: среднего арифметического (х) и стандартного отклонения (у). Оба они получается путем несложных расчетов:

формула среднего арифметического и стандартного отклонения

Где n - число членов выборки, ?N - сумма полученных ими результатов, ?d - сумма значений всех индивидуальных отклонений от среднего арифметического.

Нормальным считается такое распределение результатов, при котором в пределах одного стандартного отклонения (х ± у) находится 68 % испытуемых (то есть 34 % меньше среднего, 34 % больше среднего). Тогда в пределах двух стандартных отклонений останется 94,45 % испытуемых, а в пределах трех стандартных отклонений - почти все из них (99,73 %). Зачем это все необходимо?

Тем самым и достигается возможность классифицировать испытуемых по отношению ко всей популяции, то есть судить о том, что они входят в группу людей с показателями выше или ниже нормы.

Для удобства работы осуществляют преобразование «сырых» баллов в стандартные единицы (стандартизацию). Сохраняя относительные позиции испытуемых, изменяют среднее арифметическое и стандартное отклонение путем добавления некоей константы к каждой отдельной величине. В психологии широко используется несколько таких шкал стандартных норм. Например, шкала Т-величин имеет среднее арифметическое 50 и стандартное отклонение 10, а, скажем, шкала коэффициента интеллекта имеет среднее равным 100, со стандартным отклонением 15 и т.д.

Интерпретируются эти показатели следующим образом: все результаты, которые не выходят за границы (х ± у), находятся в пределах нормы. Те же лица, кто по тесту интеллекта получил значение IQ менее 85, находятся ниже нормы, а те, чьи результаты более 115 - выше нормы, далее, результаты от 115 до 130 интерпретируются как «несколько выше нормы», а от 130 до 145 - «значительно выше нормы». Соответственно классифицируются и результаты, располагающиеся ниже нормы.

Критериально-ориентированные тесты не предполагают подобного сопоставления данных испытуемых с итогами предварительного тестирования выборки. За точку отсчета в них принято не нормальное распределение, а определенный объем требований общества к психическому и личностному развитие его членов. Этот весьма обобщенный по своей природе феномен выражается в разрабатываемой составителями совокупности конкретных критериев.

В формулировке каждого такого критерия выделяется две части:

  • - содержательно-операциональная, четко характеризующая особенности действий испытуемых при выполнении тестовых заданий (типа «объясняет», «вычисляет», «подразделяет», «выбирает» и т. д.);
  • - соотносительно-предметная, детально описывающая тот или иной фрагмент области содержания знания на материале которого составлены тестовые задания. Обычно эта часть получает конкретизацию в ходе анализа составителями учебных программ, образовательных стандартов, действующих учебно-методических пособий и указаний.

Другими словами, одна часть критерия определяет, как надо сделать работу (каким образом), а другая - что надо сделать из предназначенного для усвоения (какой материал).

Разумеется, не каждая область знания поддается последовательной формализации для выражения в виде совокупности критериев. КОРТы, как правило, разрабатываются для диагностики сформированности умственных действий, а также для контроля за состоянием знаний, умений и навыков обучаемых. В этих случаях их применение позволяет, по словам А. Анастази, осуществлять интерпретацию с упором на то «что индивид может делать и что он делает, а не на то, как он выглядит на фоне других».

Заметно большее распространение в настоящее время имеют тесты, интерпретация выполнения которых ориентирована на статистическую норму.

В зависимости от предмета измерения выделяют тесты:

  • - интеллекта, обеспечивающие изучение уровня развития мышления и познавательных процессов в целом;
  • - способностей, оценивающие обучаемость, возможность и легкость овладения определенными знаниями, умениями и навыками. Сюда относят тесты общих и специальных способностей;
  • - достижений, определяющие обученность, то есть уровень овладения знаниями, умениями и навыками в какой-либо области (учебной, профессиональной, спортивной);
  • - личности, направленные на изучению различных аспектов личностного развития, таких как интересы, мотивы, эмоции, отношения и др.;
  • - межличностные, предусматривающие оценку человеческих отношений в группе, выявление специфики коммуникативных процессов.

По характеру тестовых заданий различают следующие виды тестов:

  • - вербальные, материал которых представлен в словесной форме;
  • - образные, где работа испытуемых производится с рисунками, схемами на основе возникающих при этом наглядных представлений;
  • - практические, выполняемые при манипулировании реальными объектами или их заместителями;
  • - комбинированные, объединяющие в себе как вербальный, так и невербальный материал заданий.

По форме предъявления заданий тесты подразделяются на бланковые («бумаги и карандаша»), аппаратурные, рисуночные и устные.

В зависимости от количества испытуемых тесты делятся на индивидуальные и групповые.

По времени выполнения тесты бывают двух видов:

  • - скорости, в которых основным показателем работы испытуемых является темп решения заданий. Оценивается либо общее количество правильно выполненных заданий за отведенное время, либо объем времени, затраченного на выполнение теста;
  • - результативности, где показатель скорости работы испытуемых не имеет соотнесения с результатами тестирования, не влияет на них. Временное ограничение (если оно есть) не является жестким, оно служит лишь целям обеспечения стандартизации процедуры измерения.

Следует заметить, что в психодиагностической практике наряду с тестами находят активное применение личностные опросники. Это методики, задания которых представлены в виде вопросов или утверждений. Задача испытуемого - дать письменные или устные ответы, сообщить информацию о себе, выразить отношение, сформулировать мнения.

По своей сути, опросники предполагают осуществление испытуемым субъективного самоотчета. От анкет, которые будут детально рассмотрены нами в дальнейшем, личностные опросники отличаются следующим:

  • 1) направленностью на изучение психологических особенностей;
  • 2) стандартизацией процедур применения и интерпретации;
  • 3) опорой на содержание определенной научной концепции, теории;
  • 4) наличием норм выполнения или соответствующих критериев развития, по отношению к которым осуществляется стандартизация индивидуальных результатов.
  • 5) проверкой степени валидности и надежности.

Все это, а также нередко более искусная постановка вопросов, маскирующая их диагностическую специфику, и тщательная разработка контроля за достоверностью и искренностью ответов («шкалы лжи»), позволяют считать их «тестами-опросниками», а не методиками самонаблюдения или традиционного опроса.

Примерами таких тестов-опросников являются Миннесотский многоаспектной личностный перечень (ММРI), разработанный С. Хатуэем и Дж. Маккинли в 1940 году и до сих пор широко использующийся в клинической психодиагностике, Патохарактерологический диагностический опросник (ПДО), предложенный А. Е. Личко (1970) для определения психопатического развития личности и акцентуаций характера, методика многофакторного исследования личности Р. Кеттелла (16-ти факторный опросник) и т. д.

В заключение, необходимо отметить следующее: использование метода тестов для исследований требует наличия как общепсихологических знаний, так и компетентности в области теории и практики измерения. Дело в том, что изучение сложных психических феноменов не сводится к чисто «технической» деятельности по предъявлению заданий и регистрации решений. Недостаток квалификации нередко оборачивается потерей индивидуального подхода, грубейшими дефектами интерпретации результатов, увеличением числа ошибок при организации процедуры испытания.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Тестирование как метод психологических исследований

тестирование интеллектуальный психический личность

В переводе с английского языка «тест» - испытание, проба, проверка. В психологии, социологии, педагогике и других науках о человеке это слово употребляется в качестве термина, обозначающего систему заданий, подобранных с таким расчетом, чтобы можно было точно и обоснованно охарактеризовать конкретные особенности лиц, выполнивших эти задания. Они конструируются, выверяются, используются и интерпретируются по строгим и независящим от специфики той или иной науки правилам, призванным обеспечить качество выводов.

Рассмотрим метод исследования, предусматривающий анализ деятельности испытуемых с такими заданиями. В психодиагностике под тестированием понимают стандартизированное испытание, предназначенное для установления количественных (и качественных) индивидуально-психологических различий. Подчеркивая точность вычисления результатов и максимальную изолированность их от влияния людей, организующих данную процедуру, о тестировании часто говорят как об «измерении» особенностей психики.

Следует заметить, что ключевое понятие в приведенном выше определении - стандартизированность. Что это такое?

Во-первых, это обозначение единообразия требований ко всем условиям тестирования и инструкциям по его проведению и обработке результатов. В отношении разных лиц тест применяется унифицированно, по одному и тому же стандарту. Тем самым обеспечивается определенная гарантия уравнивания ситуативных факторов, способных поставить часть испытуемых в более выгодное положение по сравнению с остальными. Без стандартизации становится невозможным сопоставление индивидуальных результатов.

Так, например, инструкции обычно предъявляются в письменном виде или (реже) зачитываются, но никак не формулируются по памяти, своими словами. После этого никому не дается персональных пояснений, индивидуальных комментариев и т. п.

Во-вторых, стандартизированностью называют перевод первичных («сырых») тестовых баллов, отражающих количество выполненных заданий, в более обобщенную шкалу, характеризующую степень индивидуальной выраженности данного психического свойства или функции.

Допустим, при выполнении теста интеллекта испытуемый успешно решил определенное количество заданий. Зная только это, мы не можем еще ничего сказать о том, каков уровень его интеллекта. В самом деле, много им сделано или мало? Хорошо прошло для него испытание или плохо? Часто ли такой показатель встречается у других? А сколько заданий следовало бы выполнить, чтобы засвидетельствовать высокий уровень интеллекта?

На все эти вопросы невозможно дать ответ, не имея единой для всех системы отсчета, некоего эталона. В качестве последнего обычно выступают итоги тестирования многочисленной и репрезентативной выборки. Сравнивая одного испытуемого с другими, делавшими ранее тот же тест, мы осуществляем стандартизацию по статистической норме. В последнее время все чаще применяется и несколько иной вид стандартизации, когда результаты испытуемого сопоставляют не с другими результатами, а с описанием требований общества к развитию данной функции или свойства, то есть с социально-психологическим нормативом. Как бы то ни было, стандартизация обеспечивает возможность перехода от сведений по выполнению конкретного теста тем или иным лицом к психологическим характеристикам, лежит в основе единообразия интерпретации.

Обратимся к истории начального этапа развития метода тестов.

Известно, что уже в глубокой древности существовали более или менее типовые процедуры выявления индивидуальных различий между людьми. Так, в Китае более четырех тысяч лет назад высшие чиновники обязаны были выдержать в присутствии императора строгий экзамен по знанию ритуалов и церемоний, стрельбе из лука, верховой езде, умению писать, считать, музицировать. В древнем Вавилоне и в Египте претендент на должность писца должен был доказать обладание соответствующими навыками, разбираться в финансах, законах, сельском хозяйстве. В библии описаны своеобразные способы отбора воинов на особо трудные и опасные задания в зависимости от их действий на привале. В античной Греции и Риме разрабатывались весьма подробные классификации характеров и закономерности их определения по поведенческим признакам...

Несмотря на то, что все это и многое другое исторически предшествовало тестированию, возникновение научных тестов следует отнести лишь к концу девятнадцатого века. Сам термин был введен создателем первых антропометрических тестов Френсисом Гальтоном (1822 -1911), занимавшимся исследованием остроты зрения и слуха, мускульной силы и т. п. Однако наибольшую популярность этот термин приобрел после выхода в свет в 1890 году статьи «Умственные тесты и измерения», написанной американским психологом, родоначальником современного тестирования Джеймсом Кеттеллом (1860-1944). В этой статье Кеттелл писал о том, что применение серии статистически обрабатываемых заданий к большому количеству индивидов как ничто другое способствует преобразованию психологии в точную науку. Им же впервые была высказана мысль о необходимости стандартизации ситуации обследования.

Кеттелл разработал несколько десятков тестов, направленных на оценку элементарных сенсомоторных процессов (чувствительности, времени реакции, количества воспроизводимых звуков после разового прослушивания и др.).

Довольно быстро возникла потребность в ориентации тестов на высшие психические функции. Качественный рывок в этом направлении связан с именем Альфреда Бине (1857-1911), составившего по поручению министерства образования Франции в 1905 году серию тестов интеллекта.

Тестирование по шкале Бине начиналось с предъявления заданий, соответствующих хронологическому возрасту ребенка (то есть тех, которые успешно решались подавляющим большинством его сверстников). Если он успешно справлялся с работой, предлагался материал, рассчитанный на более старших детей. В случае, если ребенок решал лишь часть новых заданий, испытание прекращалось. При этом к количеству лет базового умственного возраста (тому, где были все задания решены) прибавлялось несколько месяцев умственного возраста (пропорционально количеству решенных заданий для более старших). Если же ребенок не справлялся со всеми заданиями своей возрастной группы, ему давался материал для более младших, пока не доходили до возраста, все задания которого успешно решались.

По А. Бине, характеристикой интеллекта являлась разность между умственным и хронологическим возрастами. Однако, как легко заметить, одна и та же разность для той или иной возрастной ступени приобретает неодинаковое значение. Такое обстоятельство весьма неудобно. Для его устранения немецкий психолог Вильям Штерн (1875-1938) предложил в 1912 году определять не разность, а соотношение (частное) умственного и хронологического возрастов, то есть делить показатели один на другой. Полученное число, умноженное на 100, он назвал величиной коэффициента интеллекта (IQ).

Заметим, что в большинстве современных тестов интеллекта принята иная процедура определения коэффициента, предложенная американским психологом и психиатром Дэвидом Векслером (1896-1981). Она основана на применении единицы стандартных отклонений, показывающей, как соотносятся результаты испытуемого с интеллектом группы его сверстников.

Тесты, созданные в начале века, были индивидуальными. Использовать их могли лишь высококвалифицированные психологи. В период первой мировой войны в Америке возникла необходимость массовых обследований призывников на предмет оптимального распределения их с учетом индивидуальных особенностей. По поручению военного ведомства Артур Отис (1888-1963) разработал первые групповые тесты - «альфа» и «бета». Одна из форм предназначалась для определения интеллекта у лиц, хорошо знающих английский язык, а другая была ориентирована на малограмотных и иностранцев. Эти тесты были значительно упрощены по процедуре применения и оценке результатов.

С 20-х гг. началось широкое распространение тестирования во всем мире. При этом, наряду с тестами общего интеллекта, стало активно развиваться и более конкретное, приближенное к потребностям повседневной диагностической практики тестирование специальных способностей и профессиональных достижений. В 30-е - 40-е гг. происходит становление психодиагностики личности, осуществляемой при помощи тестов, опросников, проективных методик.

Именно тогда на несколько десятилетий были прекращены все психодиагностические исследования в СССР. Это стало следствием постановления ЦК ВКП(б), осудившего (1934 г.) существовавшую в то время педологию - науку о целостном изучении ребенка с помощью комплекса методов психологии, анатомии, физиологии, медицины и педагогики.

В настоящее время в нашей стране, как и во всем мире, тестирование является одним из основных методов психологического исследования. Динамично развивается его инструментарий, непрерывно совершенствуются способы обработки и интерпретации информации.

Одним из наиболее важных вопросов разработки теста следует признать необходимость тщательного выявления качества измерения. На последних страницах журналов иногда печатают так называемые «популярные тесты». В отечественной школе все чаще применяются «тесты учителей». В строгом смысле слова те и другие нельзя отнести к тестам, так как показатели их надежности и валидности не установлены.

Надежность - это помехоустойчивость теста, независимость его результатов от действия случайных факторов.

Можно ли в дальнейшем применять тест, если на этапе проверки его качества испытуемые каждый раз получают оценки, значительно расходящиеся с предыдущими своими оценками? Ведь если исследуемый признак по своей природе стабилен, то результаты повторных тестирований одних и тех же лиц должны быть сходными, почти не отличающимися от полученных ранее. Надежность является характеристикой точности измерения. Она позволяет судить о том, в какой мере можно доверять данным тестирования.

Причинами недостаточной надежности тестов являются:

Разнообразие ситуационных условий испытания, меняющихся от одного случая к другому (различия в манере поведения тестирующего лица, наличие посторонних помех, непредусмотренное присутствие других людей, вариативность освещенности помещения и температуры воздуха и т. д.);

Несовершенство разработанного теста (нечеткость инструкций, принципиальная разнородность заданий, допущение элементов субъективизма при интерпретации выполнений и т. д.);

Изменения внутренних состояний испытуемых (усталость, раздражение, апатия, нервозность и др.), а также их отношений к тестированию.

Максимальное устранение названных причин способствует достижению приемлемой надежности теста.

Количественным выражением данной характеристики служат коэффициенты надежности. Каждый из них освещает какую-либо сторону, определенный аспект точности измерения. Прежде чем мы перейдем к рассмотрению типов надежности, заметим, что процедура исчисления значений коэффициентов обычно предполагает установление корреляции рангов всех членов выборки, в отношении которых тест проверяется составителями перед внедрением его в психодиагностическую практику. В связи с тем, что корреляционный анализ в дальнейшем изучается как самостоятельный метод, укажем лишь одно: величина коэффициента надежности тем больше, чем неизменнее место (ранг) испытуемых по отношению ко всем другим рангам в выборке. Иначе говоря, положение результатов каждого испытуемого в общем ряду показателей выполнения теста должно всякий раз сохраняться.

На практике применяются чаще всего следующие типы данной характеристики теста:

1. Ретестовая надежность, определяемая при повторном обследовании тестом одних и тех же лиц.

Здесь есть одна проблема: если интервал времени между тестированиями небольшой, то заметно влияние эффекта тренировки, если же временной промежуток значителен, то за этот период вполне может измениться сам исследуемый признак. Тем не менее, ретестовая надежность является важной характеристикой, она позволяет установить степень независимости результатов тестирования от воздействий проводящих его людей, а также от возможных изменений ситуаций обследования.

Считается необходимым, чтобы коэффициент такой надежности был не ниже 0,80. В противном случае точность измерения недостаточна, процедура тестирования нуждается в дополнительной стандартизации.

2. Надежность частей теста, которая характеризует степень однородности (или, как говорят, гомогенности) всех его заданий. Это свидетельство, что разработанный тест отражает актуальное состояние только одного психического феномена, а все его задания взаимно согласованы, непротиворечивы и неразнонаправленны.

Чаще всего для применения этого способа задания делятся на четные и нечетные. Результаты выполнения людьми тех и других обрабатываются отдельно, а затем сопоставляются.

Тест считается надежным, если полученный при сопоставлении коэффициент превышает 0,75. В том случае, когда данный показатель не достигает указанной величины (а это не редкость при разработке теста), составителю необходимо выявить, какие именно задания следует переделать или изъять из употребления.

3. Надежность параллельных форм устанавливается, если составителем разработано несколько взаимозаменяемых наборов заданий, то есть тех, которые по своему содержанию являются весьма сходными, но не идентичными, напоминая варианты заданий школьной контрольной работы.

Принятая процедура определения такой надежности предусматривает, что выборка делится на две равные части, затем одной из них предлагается первая форма теста, а другой - вторая. Через некоторое время производится повторное тестирования, но в обратном порядке. Коэффициент надежности устанавливается методом корреляционного анализа результатов обоих тестирований. Его величина не должна быть менее 0,75. В противном случае становится необходимой проверка степени стандартизированности испытания и изменение содержания тех заданий, которые оказались несоответствующими своим аналогам из параллельной формы.

Итак, надежность теста характеризует степень точности измерения, не сообщая о том, что же именно измеряется. Она является предпосылкой наличия другого важного качества - валидности.

Валидность (от англ. «действительный», «пригодный», «имеющий силу») - комплексная характеристика теста, указывающая на обоснованность и эффективность его применения.

В классической тестологии выделяется множество типов валидности. Проанализируем наиболее распространенные из них.

Такая валидность имеет особое значение в критериально-ориентированных тестах (КОРТ) и тестах достижений, о которых речь пойдет ниже.

2. Конструктная валидность отражает степень соотнесения результатов теста с базовыми для него теоретическими понятиями (конструктами). Определяется, когда предмет измерения существует в неявном, комплексном виде, требует специального анализа.

Например, если тест разрабатывается для установления степени понимания речи, то необходимо, как минимум, представлять, какие компоненты образуют этот конструкт. Выберите из предложенного здесь перечня только те пункты, которые относятся к «пониманию речи»:

Ребенок может ответить на вопросы;

Он очень внимателен при слушании;

Он может пересказать услышанное своими словами;

Он может дословно запомнить текст с первого раза;

Он может составить план текста;

Он задает экспериментатору много вопросов по услышанному...

Очевидно, что только часть из них имеет отношение к рассматриваемому конструкту. Осуществив анализ проблемы, мы можем в дальнейшем составить задания, отражающие разные аспекты понимания речи.

После этого формулируется ряд гипотез о том, каким образом данные разрабатываемого теста будут коррелировать с широким кругом других тестов, направленных как на близкие конструкты, так и на отдаленные. Гипотезы проверяются методами корреляционного и факторного анализа. Подтверждение или опровержение совокупности теоретически ожидаемых связей становится характеристикой конструктной валидности теста.

3. Критериальная валидность показывает, как результаты тестирования соотносятся с теми оценками измеряемого качества или свойства, которые получены другими (нетестовыми) способами, а именно: с мнениями специалистов, данными наблюдений и экспериментов, анализом продуктов деятельности испытуемых и т. д. Она может быть двух типов:

Валидностью текущей, когда результаты теста сопоставляются с данными из других источников, собираемых одновременно с тестированием;

Валидностью прогностической (предсказывающей), когда результаты теста сопоставляются с более поздним поведением испытуемого в данной сфере. К примеру, итоги тестирования учебных достижений в выпускном классе могут быть подтверждены, а могут быть и опровергнуты фактами о поступлении членов выборки в высшие учебные заведения.

Иногда применительно к некоторым из описанных типов валидности употребляют обозначение «эмпирическая валидность». Так называют те из них, при определении степени выраженности которых использовались статистические способы анализа данных, то есть коэффициенты вычислялись путем корреляций.

Каким образом соотносятся между собой характеристики эмпирической валидности и надежности?

Если высокая надежность теста свидетельствует, что он точно измеряет нечто, то высокая валидность указывает, что тест измеряет именно то, для чего он был разработан. Поэтому коэффициенты валидности не могут превышать значений коэффициентов надежности.

Обе рассмотренные характеристики непременно определяются составителями в ходе подготовки теста. Психолог, использующий тест в своей работе, благодаря этому получает представление о качестве измерения. Следует сказать и о том, что повторную проверку на надежность и валидность обычно проходят тесты, заимствованные, переведенные на другой язык. Без этого невозможно судить о качестве их социокультурной адаптации к новым условиям использования.

Бывает так, что тест обладает адекватной валидностью и надежностью, но тем не менее, почти не находит применения в исследовательской практике. Это может быть обусловлено излишней сложностью процедуры интерпретации, чрезмерно высокими требованиями к квалификации тестирующего, значительной трудоемкостью и длительностью применения и т. д. Необходимо считать существенной еще одну характеристику психологического измерения - его экономичность.

Под экономичностью понимают целесообразность применения теста, определяемую наличием допустимого соотношения затрат на тестирование (времени, труда, финансов) и пользы от него.

Сказанное, разумеется, не означает, что тестирование непременно должно быть легким, коротким и «дешевым», пусть даже в ущерб другим качествам измерения. Речь идет именно о допустимом соотношении надежности, валидности и экономичности.

Перейдем к изучению основных видов тестов. Для этого воспользуемся одной из наиболее распространенных классификаций. В зависимости от особенностей интерпретации выполнения тесты подразделяются на два вида:

Ориентированные на статистическую норму;

Критериально-ориентированные (КОРТ).

Первые из них предполагают использование традиционного приема математической статистики - «нормирования» результатов. Что это такое?

Процедура разработки такого теста обязательно предусматривает установление норм его выполнения путем предварительного тестирования репрезентативной выборки лиц, для которых он предназначен. При этом выявляется диапазон тестовых баллов, характерный для низкого уровня развития данного психического свойства или функции, среднего уровня и высокого. В дальнейшем результаты испытуемого сравнивают с данными, полученными при тестировании выборки, определяя тем самым относительное его место в общем ряду.

Следует заметить, что задания ориентированного на статистическую норму теста подбираются таким образом, чтобы итоги их выполнения выборкой приближались к кривой нормального распределения Гаусса.

Описание подобного распределения результатов может быть сделано с помощью двух показателей: среднего арифметического (х) и стандартного отклонения (у). Оба они получается путем несложных расчетов:

формула среднего арифметического и стандартного отклонения

Где n - число членов выборки, ?N - сумма полученных ими результатов, ?d - сумма значений всех индивидуальных отклонений от среднего арифметического.

Нормальным считается такое распределение результатов, при котором в пределах одного стандартного отклонения (х ± у) находится 68 % испытуемых (то есть 34 % меньше среднего, 34 % больше среднего). Тогда в пределах двух стандартных отклонений останется 94,45 % испытуемых, а в пределах трех стандартных отклонений - почти все из них (99,73 %). Зачем это все необходимо?

Тем самым и достигается возможность классифицировать испытуемых по отношению ко всей популяции, то есть судить о том, что они входят в группу людей с показателями выше или ниже нормы.

Для удобства работы осуществляют преобразование «сырых» баллов в стандартные единицы (стандартизацию). Сохраняя относительные позиции испытуемых, изменяют среднее арифметическое и стандартное отклонение путем добавления некоей константы к каждой отдельной величине. В психологии широко используется несколько таких шкал стандартных норм. Например, шкала Т-величин имеет среднее арифметическое 50 и стандартное отклонение 10, а, скажем, шкала коэффициента интеллекта имеет среднее равным 100, со стандартным отклонением 15 и т.д.

Интерпретируются эти показатели следующим образом: все результаты, которые не выходят за границы (х ± у), находятся в пределах нормы. Те же лица, кто по тесту интеллекта получил значение IQ менее 85, находятся ниже нормы, а те, чьи результаты более 115 - выше нормы, далее, результаты от 115 до 130 интерпретируются как «несколько выше нормы», а от 130 до 145 - «значительно выше нормы». Соответственно классифицируются и результаты, располагающиеся ниже нормы.

Критериально-ориентированные тесты не предполагают подобного сопоставления данных испытуемых с итогами предварительного тестирования выборки. За точку отсчета в них принято не нормальное распределение, а определенный объем требований общества к психическому и личностному развитие его членов. Этот весьма обобщенный по своей природе феномен выражается в разрабатываемой составителями совокупности конкретных критериев.

В формулировке каждого такого критерия выделяется две части:

Соотносительно-предметная, детально описывающая тот или иной фрагмент области содержания знания на материале которого составлены тестовые задания. Обычно эта часть получает конкретизацию в ходе анализа составителями учебных программ, образовательных стандартов, действующих учебно-методических пособий и указаний.

Другими словами, одна часть критерия определяет, как надо сделать работу (каким образом), а другая - что надо сделать из предназначенного для усвоения (какой материал).

Разумеется, не каждая область знания поддается последовательной формализации для выражения в виде совокупности критериев. КОРТы, как правило, разрабатываются для диагностики сформированности умственных действий, а также для контроля за состоянием знаний, умений и навыков обучаемых. В этих случаях их применение позволяет, по словам А. Анастази, осуществлять интерпретацию с упором на то «что индивид может делать и что он делает, а не на то, как он выглядит на фоне других».

Заметно большее распространение в настоящее время имеют тесты, интерпретация выполнения которых ориентирована на статистическую норму.

В зависимости от предмета измерения выделяют тесты:

Интеллекта, обеспечивающие изучение уровня развития мышления и познавательных процессов в целом;

Способностей, оценивающие обучаемость, возможность и легкость овладения определенными знаниями, умениями и навыками. Сюда относят тесты общих и специальных способностей;

Достижений, определяющие обученность, то есть уровень овладения знаниями, умениями и навыками в какой-либо области (учебной, профессиональной, спортивной);

Личности, направленные на изучению различных аспектов личностного развития, таких как интересы, мотивы, эмоции, отношения и др.;

Межличностные, предусматривающие оценку человеческих отношений в группе, выявление специфики коммуникативных процессов.

По характеру тестовых заданий различают следующие виды тестов:

Вербальные, материал которых представлен в словесной форме;

Образные, где работа испытуемых производится с рисунками, схемами на основе возникающих при этом наглядных представлений;

Практические, выполняемые при манипулировании реальными объектами или их заместителями;

Комбинированные, объединяющие в себе как вербальный, так и невербальный материал заданий.

По форме предъявления заданий тесты подразделяются на бланковые («бумаги и карандаша»), аппаратурные, рисуночные и устные.

В зависимости от количества испытуемых тесты делятся на индивидуальные и групповые.

По времени выполнения тесты бывают двух видов:

Скорости, в которых основным показателем работы испытуемых является темп решения заданий. Оценивается либо общее количество правильно выполненных заданий за отведенное время, либо объем времени, затраченного на выполнение теста;

Результативности, где показатель скорости работы испытуемых не имеет соотнесения с результатами тестирования, не влияет на них. Временное ограничение (если оно есть) не является жестким, оно служит лишь целям обеспечения стандартизации процедуры измерения.

Следует заметить, что в психодиагностической практике наряду с тестами находят активное применение личностные опросники. Это методики, задания которых представлены в виде вопросов или утверждений. Задача испытуемого - дать письменные или устные ответы, сообщить информацию о себе, выразить отношение, сформулировать мнения.

По своей сути, опросники предполагают осуществление испытуемым субъективного самоотчета. От анкет, которые будут детально рассмотрены нами в дальнейшем, личностные опросники отличаются следующим:

2) стандартизацией процедур применения и интерпретации;

3) опорой на содержание определенной научной концепции, теории;

4) наличием норм выполнения или соответствующих критериев развития, по отношению к которым осуществляется стандартизация индивидуальных результатов.

5) проверкой степени валидности и надежности.

Все это, а также нередко более искусная постановка вопросов, маскирующая их диагностическую специфику, и тщательная разработка контроля за достоверностью и искренностью ответов («шкалы лжи»), позволяют считать их «тестами-опросниками», а не методиками самонаблюдения или традиционного опроса.

Примерами таких тестов-опросников являются Миннесотский многоаспектной личностный перечень (ММРI), разработанный С. Хатуэем и Дж. Маккинли в 1940 году и до сих пор широко использующийся в клинической психодиагностике, Патохарактерологический диагностический опросник (ПДО), предложенный А. Е. Личко (1970) для определения психопатического развития личности и акцентуаций характера, методика многофакторного исследования личности Р. Кеттелла (16-ти факторный опросник) и т. д.

В заключение, необходимо отметить следующее: использование метода тестов для исследований требует наличия как общепсихологических знаний, так и компетентности в области теории и практики измерения. Дело в том, что изучение сложных психических феноменов не сводится к чисто «технической» деятельности по предъявлению заданий и регистрации решений. Недостаток квалификации нередко оборачивается потерей индивидуального подхода, грубейшими дефектами интерпретации результатов, увеличением числа ошибок при организации процедуры испытания.

Размещено на Allbest.ru

...

Подобные документы

    Понятие и виды эксперимента, его организация. Этические проблемы при его проведении. Использование теста для объективной оценки индивидуально-психологических различий. Сущность исследований человека в социальном контексте посредством качественных методов.

    реферат , добавлен 16.02.2011

    Диагностирование развития и функционирования когнитивных психических процессов и состояний, индивидуальных нейрофизиологических особенностей. Изучение эмоционально-волевой и мотивационной сферы. Анализ индивидуально-психологических особенностей.

    курсовая работа , добавлен 24.06.2011

    Понятие о генетической психофизиологии. Роль генетических и средовых факторов в формировании физиологических систем организма и индивидуально-психологических различий личности. Место психофизиологических исследований в системе психогенетических знаний.

    реферат , добавлен 09.12.2014

    Взаимосвязь профессионализма и индивидуальных психологических особенностей личности. Актуальность диагностики профессиональной пригодности людей, ее взаимосвязь с дальнейшим становлением профессионализма. Понятие личность в психологии, свойства личности.

    курсовая работа , добавлен 14.08.2010

    Группы методов психологических исследований, их классификация. Сущность и основные задачи анкетирования, наблюдения, беседы. Особенности проведения естественного, лабораторного и моделирующего эксперимента. Анализ методов психологических исследований.

    курсовая работа , добавлен 05.03.2012

    Актуальность диагностики профпригодности людей, ее взаимосвязь с дальнейшим становлением профессионализма. Влияние психологических факторов на эффективность обучения. Различные подходы к пониманию структуры личности. Условия развития способностей.

    контрольная работа , добавлен 15.01.2016

    Психодиагностика как метод психологического исследования. Психологическое тестирование и опрос. Характерологический опросник Леонгарда. Уровень субъективного контроля Дж. Роттера, опросник Р. Кеттела. Индивидуально-типологический опросник Л.Н. Собчик.

    курсовая работа , добавлен 22.01.2012

    Связь методологии и методов в социально-психологическом исследовании. Характеристика избирательного внимания к различным методам в современных социально-психологических исследованиях. Метод наблюдения, тестирование, методика опроса и эксперимент.

    курсовая работа , добавлен 06.01.2015

    Типы и формы зависимого поведения. Психологические риски формирования зависимостей в юношеском возрасте. Представление и анализ индивидуально-психологических особенностей личности юношей и девушек. Задачи многофакторного личностного опросника Р. Кеттела.

    дипломная работа , добавлен 09.10.2013

    Изучение индивидуально-психологических особенностей подростков. Исследование воздействия биологических ритмов на физическую работоспособность школьников. Методики определения хронотипа, анаэробной производительности и уровня тревожности индивида.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

знание тестовый задание

Одним из способов быстрой проверки знаний является тестирование. Однако в настоящее время, в связи с развитием информационных технологий, дистанционного обучения и в частности адаптивных обучающих систем, тестирование может применяться как средство идентификации личности обучаемого для построения индивидуальной последовательности обучения, когда каждый обучаемый проходит учебные курсы в том порядке и в том объеме, которые наиболее соответствуют его уровню подготовленности. В технологии дистанционного обучения при отсутствии непосредственного контакта обучаемого с преподавателем тестирование становится одним из основных средств контроля знаний, поэтому особенно остро встает проблема создания качественных тестов, которые могли бы быстро, объективно и адекватно измерять уровень знаний обучаемых.

Можно различать три вида тестирования:

· предварительное;

· текущее;

· итоговое.

Предварительное тестирование применяется перед началом обучения и направлено на выявление предварительных знаний обучаемого по ряду дисциплин, которые ему предстоит изучать. Сюда же могут включаться психологические тесты для определения индивидуальных характеристик личности обучаемого, которые учитываются в ходе обучения для настройки на работу с конкретным обучаемым. По результатам предварительного тестирования строится предварительная последовательность изучения учебных курсов.

Текущее тестирование - это контроль или самоконтроль знаний по отдельному элементу учебного курса, например, разделу или теме. По его результатам строится последовательность изучения тем и разделов внутри курса, а также может осуществляться возврат к темам, которые были изучены недостаточно хорошо.

Итоговое тестирование - это контроль знаний по курсу в целом или по совокупности курсов. По его результатам корректируется последовательность изучения учебных курсов.

При работе с тестами всегда нужно учитывать надежность результатов тестирования. Под надежностью тестовых результатов понимается характеристика, показывающая точность измерения знаний заданиями теста. Нужно отметить, что речь идет не о надежности теста, а о надежности результатов тестирования, т.к. на нее сильно влияет степень однородности различных групп обучаемых, уровень их подготовленности и ряд других факторов, связанных не с самим тестом, а с условиями проведения процесса тестирования.

1. Классификация тестов, методы тестирования, достоинства и недостатки тестовой проверки знаний студентов

1.1 Тестирование как метод исследования

Тестирование (англ. test - испытание, проверка) - экспериментальный метод психодиагностики, применяемый в эмпирических социологических исследованиях, а также метод измерения и оценки различных психологических качеств и состояний индивида .

Возникновение тестологических процедур было обусловлено потребностью сопоставления (сравнения, дифференциации и ранжирования) индивидов по уровню развития или степени выраженности различных психологических качеств.

Широкому распространению, развитию и совершенствованию тестов способствовал целый ряд преимуществ, которые дает этот метод. Тесты позволяют дать оценку индивида в соответствии с поставленной целью исследования; обеспечивают возможность получения количественной оценки на основе квантификации качественных параметров личности и удобство математической обработки; являются относительно оперативным способом оценки большого числа неизвестных лиц; способствуют объективности оценок, не зависящих от субъективных установок лица, проводящего исследование; обеспечивают сопоставимость информации, полученной разными исследователями на разных испытуемых.

К тестам предъявляют следующие требования:

Строгая формализация всех этапов тестирования;

Стандартизация заданий и условий их выполнения;

Квантификация полученных результатов и их структурирование по заданной программе;

Интерпретации результатов на основе предварительно полученного распределения по изучаемому признаку.

Каждый тест, соответствующий критериям надежности, кроме набора заданий включает в себя следующие компоненты:

1) стандартная инструкция для испытуемого о цели и правилах выполнения заданий;

2) ключ шкалирования - соотнесение пунктов заданий со шкалами измеряемых качеств, указывающее, какой пункт заданий к какой шкале относится;

4) ключ интерпретации полученного индекса, представляющий собой данные нормы, с которыми соотносится полученный результат .

Традиционно нормой в тестологии являлись среднестатистические данные, полученные в результате предварительного тестирования на определенной группе лиц. Здесь необходимо учитывать, что переносить интерпретацию полученных результатов можно только на такие группы испытуемых, которые по своим основным социокультурным и демографическим признакам аналогичны базовой.

Для преодоления основного недостатка большинства тестов применяются различные приемы:

1) увеличение базовой выборки с целью повышения ее репрезентативности по большему числу параметров;

2) введение поправочных коэффициентов с учетом характеристик выборки;

3)введение в практику тестирования невербального способа предъявления материала.

Тест состоит из двух частей:

а) стимулирующего материала (задача, инструкция или вопрос);

б) указаний относительно регистрации или интеграции полученных ответов.

Тесты классифицируются по разным признакам.

По виду свойств личности они делятся на тесты достижений и личностные. К первым относятся тесты интеллекта, школьной успеваемости, тесты на творчество, тесты на способности, сенсорные и моторные тесты. Ко вторым - тесты на установки, на интересы, на темперамент, характерологические тесты, мотивационные тесты. Однако не все тесты (например, тесты развития, графические тесты) можно упорядочить по данному признаку. По виду инструкции и способу применения различаются индивидуальные и групповые тесты. При групповом тестировании одновременно обследуется группа испытуемых. Если в тестах уровня временных ограничений нет, то в тестах на скорость они обязательны. В зависимости от того, насколько в результате тестирования проявляется субъективность исследователя, различают тесты объективные и субъективные.

К объективным тестам относится большинство тестов достижений и психофизиологические тесты. К субъективным - проективные тесты. Это деление в определенной степени совпадает с делением на прямые и непрямые тесты, которые различаются в зависимости от того, знают или не знают испытуемые значение и цель теста.

По формальной структуре различаются тесты простые, т.е. элементарные, результатом которых может быть единственный ответ, и тесты сложные, состоящие из отдельных подтестов, по каждому из которых должна быть дана оценка. При этом могут высчитываться и общие оценки. Комплекс нескольких единичных тестов называют тестовой батареей, графическое изображение результатов по каждому подтесту - тестовым профилем. Нередко к тестам относят опросники, удовлетворяющие ряду требований, предъявляемых обычно к данному методу сбора психологической или социологической информации.

В последнее время все большее распространение получают критериально-ориентированные тесты, позволяющие оценивать испытуемого не в сопоставлении со среднестатистическими данными популяции, а по отношению к заранее заданной норме. Критерием оценки в таких тестах является степень приближения результата тестирования индивида к так называемой «идеальной норме» .

Разработка теста состоит из четырех этапов.

1) на первом этапе развивается исходная концепция с формулировкой основных пунктов испытания или основных вопросов, носящих предварительный характер;

2) на втором производится отбор предварительных пунктов испытания с последующей селекцией и приведением к окончательному виду, осуществляется одновременно оценка по качественным критериям надежности и валидности;

3) на третьем этапе тест проверяется повторно на той же самой популяции;

4) на четвертом калибруется по отношению к возрасту, уровню образования и другим признакам популяции.

На всех этапах разработки теста необходимо учитывать:

а) диагностируемое свойство личности (размер, положение, индикатор) или только наблюдаемые его проявления (способности, уровень знаний, темперамент, интересы, установки);

б) связанную с этим валидизацию метода, т.е. определение того, насколько он измеряет требуемое свойство;

в) величину выборки из популяции, на которой должна проводиться оценка метода;

г) стимулирующий материал (таблички, изображения, игрушки, фильмы);

д) влияние исследователя в процессе инструктирования, постановки задач, разъяснений, ответов на вопросы;

е) условия ситуации;

ж) такие формы поведения испытуемого, которые свидетельствуют об измеряемом свойстве;

з) шкалиpование релевантных форм поведения;

и) сведение результатов по отдельным измеряемым пунктам в общие значения (суммирование ответов типа «Да»);

к) формулировку результатов в нормированной шкале оценок.

Одним из вариантов теста может быть опросник, но при условии, что он отвечает требованиям, предъявляемым к тестам.

Опросник - это сборник вопросов, которые выбираются и располагаются по отношению друг к другу в соответствии с требуемым содержанием. Опросники используются, например, в целях психодиагностики, когда от испытуемого требуется самооценка его поведения, привычек, мнений и т.д. При этом испытуемый, отвечая на вопросы, выражает свои положительные и отрицательные предпочтения. С помощью опросников можно измерять у испытуемых и оценки ими других людей. Задание обычно выступает, как прямая реакция на вопросы, на которые надо ответить путем сожаления или опровержения. Возможности для ответа в большинстве случаев заданы и требуют лишь отметки в виде крестика, кружочка и т.п. Недостаток опросника состоит в том, что испытуемый может симулировать или диссимулировать те или иные свойства личности. Преодолеть указанный недостаток (хотя и не полностью) исследователь может посредством контрольных вопросов, контрольных шкал, шкал «лжи». Опросники применяются преимущественно для диагностики характера, диагностики личности (экстраверсии - интроверсии, интересов, установок, мотивов).

Диагностика личности - совокупность методов, позволяющих распознать ее внеинтеллектуальные свойства, носящие характер относительно устойчивых диспозиций.

На современном этапе в прикладной социологии чаще всего используются тестовые методики, заимствованные из социальной психологии, касающиеся изучения качеств личности. Появляются тесты, специально разработанные социологами. Эти тесты часто используются в социологических анкетах.

1.2 Достоинства и недостатки тес товой проверки знаний студентов

В системе высшего образования применение тестирования знаний студентов имеет свои предпосылки. Поэтому тестирование имеет как достоинства, так и недостатки которые будут рассмотрены ниже.

В качестве достоинств можно отметить следующее:

1. Тестирование является более качественным и объективным способом оценивания. Для заочного обучения в условиях предельного ограничения количества аудиторных часов тестирование часто является единственной возможностью формирования достаточно объективной оценки знаний студентов.

2. Тестирование - более справедливый метод, оно ставит всех студентов в равные условия, как в процессе контроля, так и в процессе оценки, исключая субъективизм преподавателя.

3. Тесты это более объёмный инструмент, поскольку позволяет установить уровень знаний студента по предмету в целом, чем при выполнении контрольной работы.

4. Тестирование существенно экономит время преподавателя, отводимое на контроль знаний студентов, по сравнению с проверкой и защитой контрольных работ студентами заочной форме обучения. Это связано с тем, что тестированию одновременно подвергается сразу группа студентов.

Однако тестирование имеет также некоторые недостатки:

1. Жесткие временные ограничения, применяемые при выполнении тестовых заданий, исключают возможности определить структуру и уровень подготовленности тех испытуемых, которые в силу своих психофизиологических особенностей думают и делают все медленно, но при этом качественно.

2. Данные, получаемые преподавателем в результате тестирования, хотя и включают в себя информацию о пробелах в знаниях по конкретным разделам, но не позволяют судить о причинах этих пробелов.

3. Обеспечение объективности и справедливости теста требует принятия специальных мер по обеспечению конфиденциальности тестовых заданий. При повторном применении теста желательно внесение в задания изменений.

4. В тестировании присутствует элемент случайности и интуиции. Причиной этого может быть угадывание ответа студентом, поэтому при разработке теста необходимо предвидеть такую ситуацию .

2 . Модели тестирования

Остановимся на основных моделях тестирования.

Классическая модель. Данная модель является самой первой и самой простой. Имеется n заданий по определенной области знаний, по нескольким областям знаний или части области знаний (разделу, теме и т.п.). Из этого множества заданий случайным образом выбирается k заданий (k

Достоинство:

Простота реализации.

Недостатки:

Из-за случайности выборки нельзя заранее определить, какие задания по сложности достанутся обучаемому. В итоге одному обучаемому могут достаться k легких заданий, а другому - k сложных;

Оценка зависит только от количества правильных ответов и не учитывает сложность заданий.

Классическая модель из-за своих недостатков имеет самую низкую надежность, т.к. отсутствие учета параметров заданий часто не позволяет объективно оценить знания обучаемого.

В настоящее время происходит уход от использования данной модели к более совершенным и эффективным моделям, например, к адаптивному тестированию.

Классическая модель с учетом сложности заданий. Это тестирование проводится аналогично предыдущему, однако каждое задание имеет определенный уровень сложности Ti, i= и при подсчете результата тестирования учитывается сложность вопросов, на которые обучаемый дал правильный ответ. Чем выше сложность вопроса, тем выше будет результат тестирования. Для вопросов, на которые был дан неправильный ответ, сложность не учитывается.

Недостаток: из-за случайности выборки нельзя заранее определить, какие задания по сложности достанутся обучаемому. В итоге одному обучаемому могут достаться k легких заданий, а другому - k сложных.

Модели с учетом сложности заданий позволяют более адекватно подойти к оценке знаний. Но случайность выбора заданий не позволяет добиться параллельности тестов по сложности, т.е. одинаковости суммарных характеристик сложности заданий, что снижает надежность тестирования.

Модель с возрастающей сложностью. Имеется m уровней сложности. В тесте должны присутствовать задания всех уровней сложности. Из этого множества заданий случайным образом выбирается k заданий (k

Результат тестирования определяется аналогично модели с учетом сложности.

Данная модель обеспечивает параллельность тестов по сложности, т.е. надежность результатов тестирования еще выше, чем в предыдущих моделях.

Модель с разделением заданий по уровням усвоения.

Различают пять уровней усвоения учебного материала.

Нулевой уровень (Понимание) - это такой уровень, при котором обучаемый способен понимать, т.е. осмысленно воспринимать новую для него информацию. Фактически речь идет о предшествующей подготовке обучаемого .

Первый уровень (Опознание) - это узнавание изучаемых объектов при повторном восприятии ранее усвоенной информации о них или действиях с ними, например, выделение изучаемого объекта из ряда предъявленных объектов.

Второй уровень (Воспроизведение) - это воспроизведение усвоенных ранее знаний от буквальной копии до применения в типовых ситуациях. Примеры: воспроизведение информации по памяти, решение типовых задач по образцу.

Третий уровень (Применение) - это такой уровень усвоения информации, при котором обучаемый способен самостоятельно воспроизводить и преобразовывать усвоенную информацию для обсуждения известных объектов и применения ее в нетиповых ситуациях. При этом обучаемый способен генерировать новую для него информацию об изучаемых объектах. Примеры: решение нетиповых задач, выбор подходящего алгоритма из набора ранее изученных алгоритмов для решения конкретной задачи.

Четвертый уровень (Творческая деятельность) - это такой уровень владения учебным материалом темы, при котором обучаемый способен создавать новую информацию, ранее неизвестную никому. Пример: разработка нового алгоритма решения задачи.

Уровень представления обозначается a и может меняться от 0 до 4.

Задания составляются для каждого из пяти уровней. Сначала проводится тестирование с использованием заданий по уровню 0, затем по уровню 1, 2 и т.д. Перед переходом с уровня на уровень вычисляется степень владения учебным материалом на данном уровне и определяется возможность перехода на следующий уровень.

Для измерения степени владения учебным материалом на каждом уровне используют коэффициент:

где P 1 - количество правильно выполненных существенных операций в процессе тестирования;

Р 2 - общее количество существенных операций в тесте.

Под существенными операциями понимают те операции, которые выполняются на проверяемом уровне a. Операции, принадлежащие к более низким уровням, в число существенных не входят.

Исходя из этого: 0 ? К б? 1.

Таким образом, уровень усвоения учебного материала может быть использован для оценивания качества знаний у обучаемого и выставления оценки. Рекомендуются следующие критерии для выставления оценки:

К б < 0,7 Неудовлетворительно

0,7 ? К б <0,8Удовлетворительно

0,8 ? К б <0,9Хорошо

К б? 0,9 Отлично

При К б < 0,7 следует продолжать процесс обучения на том же уровне.

Модель с учетом времени ответа на задание. В данной модели при определении результата тестирования учитывается время ответа на каждое задание. Это делается для того, чтобы учесть возможность несамостоятельного ответа на задания: обучаемый может долго искать ответ в учебнике или других источниках, но в итоге его оценка все равно будет низкой, даже если на все вопросы он ответил правильно. С другой стороны, если он не пользовался подсказками, а долго думал над ответами, это означает, что он недостаточно хорошо изучил теорию, а в результате даже при правильных ответах оценка будет снижена.

Учет времени ответа может производиться, например, по формулам.

Результат ответа на i-е задание теста:

знание тестовый задание

Если R i > 1, то R i =1.

Если R i < 0, то R i =0.

где: t отв - время ответа на задание,

t max - время, в течение которого уменьшение оценки не происходит.

t max установлено для того, чтобы обучаемый имел возможность прочитать вопрос и варианты ответов, осмыслить их и выбрать правильный, по его мнению, ответ. Параметр t max может задаваться как константа для всех заданий теста или вычисляться для каждого отдельно взятого задания в зависимости от его сложности, т.е. t 2 max =f(T i), т.к. логично предположить, что для ответа на сложное задание требуется больше времени, чем на простое задание. Другая возможная зависимость параметра t max - от индивидуальных способностей обучаемого, которые должны быть определены ранее.

Результат тестирования:

Модели с учетом времени ответа на задание также позволяют повысить надежность результатов тестирования, особенно в сочетании с моделью с учетом сложности заданий.

Модель с ограничением времени на тест. Для оценки результатов тестирования берутся только те задания, на которые успел ответить обучаемый за данное время.

В настоящее время данная модель используется достаточно широко.

В некоторых работах рекомендуется обязательно сортировать задания по возрастанию сложности и устанавливать такое время тестирования, за которое на все задания теста не сможет ответить ни один, даже самый сильный обучаемый. Такой подход предлагается применять при тестировании на бланках, когда обучаемых видит перед собой сразу все задания. Суть его в том, что когда обучаемый ответит на все задания, а время у него еще останется, он может начать проверять свои ответы, сомневаться, а в итоге может исправить правильные ответы на неправильные. Поэтому рекомендуется или ограничивать время на тест или забирать бланк сразу после ответа на все задания теста.

Адаптивная модель. Данная модель является продолжением классической модели с учетом сложности заданий.

Адаптивным называется тест, в котором сложность заданий меняется в зависимости от правильности ответов испытуемого. Если обучаемый правильно отвечает на тестовые задания, сложность последующих заданий повышается, если неправильно - понижается. Также есть возможность задания дополнительных вопросов по темам, которые обучаемый знает не очень хорошо для более тонкого выяснения уровня знаний в данных областях. Таким образом, можно сказать, что адаптивная модель напоминает преподавателя на экзамене - если обучаемый отвечает на задаваемые вопросы уверенно и правильно, преподаватель достаточно быстро ставит ему положительную оценку. Если обучаемый начинает «плавать», то преподаватель задает ему дополнительные или наводящие вопросы того же уровня сложности или по той же теме. И, наконец, если обучаемый с самого начала отвечает плохо, оценку преподаватель тоже ставит достаточно быстро, но отрицательную.

Данная модель применяется для тестирования обучаемых с помощью компьютера, т.к. на бумажном бланке невозможно заранее разместить столько вопросов и в том порядке, сколько и в котором они должны быть предъявлены обучаемому.

Тестирование обычно начинается с заданий средней сложности, но можно начинать и с легких заданий, т.е. идти по принципу повышения сложности.

Тестирование заканчивается, когда обучаемый выходит на некоторый постоянный уровень сложности, например, отвечает подряд на некоторое критическое количество вопросов одного уровня сложности.

Достоинства:

1) позволяет более гибко и точно измерять знания обучаемых;

2) позволяет измерять знания меньшим количеством заданий, чем в классической модели;

3) выявляет темы, которые обучаемый знает плохо и позволяет задать по ним ряд дополнительных вопросов.

Недостатки:

1) заранее неизвестно, сколько вопросов необходимо задать обучаемому, чтобы определить его уровень знаний. Если вопросов, заложенных в систему тестирования, оказывается недостаточно, можно прервать тестирование и оценивать результат по тому количеству вопросов, на которое ответил обучаемый;

2) возможно применение только на ЭВМ.

Надежность результатов тестирования в данном случае самая высокая, т.к. осуществляется приспособление под уровень знаний конкретного обучаемого, что обеспечивает более высокую точность измерений.

Возможный алгоритм адаптивной модели тестирования. Данный алгоритм является достаточно простым и позволяет варьировать только уровень сложности, не учитывая статистику ответов на предыдущие вопросы. На каждом шаге тестирования по каждому уровню сложности обучаемому дается два задания, и по результатам ответов на них определяется уровень сложности для следующих заданий. Данное количество заданий (два) позволяют более адекватно оценивать уровень знаний, чем одно задание, на которое обучаемый может отгадать или случайно забыть ответ, и в то же время не дает большого количества сочетаний вариантов ответов, как в случае трех и тем более большего количества заданий.

Пусть имеется m уровней сложности. Вводится коэффициент k r =100/m.

Обозначим t - текущий уровень знаний обучаемого, t н - нижний уровень знаний, t в - верхний уровень знаний. Все уровни знаний будем измерять от 0 до 100 (0 - нет знаний, 100 - абсолютное знание) .

1. Установить t = 50; t н = 0; t в = 100.

2. Вычислить текущий уровень сложности T=t/k r .

3. Выдать два задания сложности T. Пусть k пр - количество правильных ответов, k пр?.

4. Пересчет уровня знаний:

· если k пр = 2, то t н = t; t в = t в + 0.5t. Если t в > 100, то t в = 100;

· если k пр = 1, то t н = t н / 4; t в = t в + 0.1t. Если t в > 100, то t в = 100;

· если k пр = 0, то t н = t н / 2; t в = t.

5. Если |t-t 1 |<е, то уровень знаний равен t 1 , выход.

6. Перейти к шагу (2).

е устанавливается исходя из необходимой точности оценки знаний. Однако с уменьшением е возрастает число вопросов, необходимых для включения в тест.

Модель тестирования по сценарию. Данная модель также является продолжением классической модели. Данная модель реализуется в системе Дистанционного Асинхронного Обучения, разрабатываемой в Татарском Институте Содействия Бизнесу (ТИСБИ) .

Существенным недостатком классической модели является непараллельность тестов для различных обучаемых, т. к. нельзя заранее определить, какие задания по сложности и по каким темам достанутся обучаемому. Поэтому при сценарном тестировании преподаватель перед тестированием формирует сценарий тестирования, где может указывать:

· количество заданий по каждой теме, которые должны быть включено в тест;

· количество заданий каждого уровня сложности, которые должны быть включено в тест;

· количество заданий каждой формы, которые должны быть включено в тест»;

· время прохождения теста

· и другие параметры.

Сценарий может создаваться по любому объему учебного материала: разделу, предмету, специальности и т.д.

Существует четыре формы тестовых заданий:

1. Задания с выбором, которые делятся на 3 подгруппы: задания с выбором одного правильного ответа или одновариантные задания, задания с выбором нескольких правильных ответов или многовариантные задания, задания с выбором наиболее правильного ответа.

2. Открытые задания.

3. Задания на установление соответствия.

4. Задания на установление правильной последовательности.

Непосредственно при тестировании выборка заданий каждого уровня сложности, по каждой теме, каждой формы и т.д. производится случайным образом из общей базы заданий, поэтому каждый обучаемый получает свои задания. Получаемые тесты для всех обучаемых являются параллельными, т.е. имеют одинаковое число заданий и одинаковую суммарную сложность. Но в отличие от модели с возрастанием сложности, которая также обеспечивает параллельность, здесь разработчик теста решает сам, сколько и каких заданий должно быть предъявлено по каждой теме, следовательно, обеспечиваются абсолютно одинаковые условия тестирования для всех обучаемых.

По сравнению с адаптивной моделью данная модель является менее эффективной, т.к. не настраивается под индивидуальные особенности каждого обучаемого, однако имеет преимущество психологического характера: при тестировании по адаптивной модели обучаемые отвечают на разное количество вопросов и как будто бы находятся в разных условиях. В случае тестирования по сценарию все обучаемые получают одинаковое количество вопросов по каждой теме и по каждому уровню сложности.

Надежность результатов тестирования сопоставима с надежностью, получаемой при тестировании с возрастанием сложности.

Модель на нечеткой математике. Цель введения нечеткой математики - попытка математической формализации нечетких, качественных явлений и объектов с размытыми границами, встречающихся в реальном мире. Нечеткое управление оказывается особенно полезным, когда описываемые процессы являются слишком сложными для анализа с помощью общепринятых количественных методов или когда доступные источники информации интерпретируются качественно, неточно или неопределенно. Экспериментально показано, что нечеткое управление дает лучшие результаты по сравнению с получаемым при общепринятых алгоритмах управления. Нечеткая логика, на которой основано нечеткое управление, ближе по духу к человеческому мышлению и естественным языкам, чем традиционные логические системы. Нечеткая логика, в основном, обеспечивает эффективные средства отображения неопределенностей и неточностей реального мира. Наличие математических средств отражения нечеткости исходной информации позволяет построить модель, адекватную реальности .

Данная модель тестирования является развитием любой предыдущей модели, в которой вместо четких характеристик тестовых заданий и ответов используются их нечеткие аналоги. Примерами могут служить:

Сложность задания («легкое», «среднее», «выше среднего», «сложное» и т.п.);

Правильность ответа («правильно», «частично правильно», «скорее неправильно», «неправильно» и т.п.);

Время ответа («маленькое», «среднее», «большое», «очень большое» и т.п.);

Процент правильных ответов («маленький», «средний», «большой», «очень большой» и т.п.);

Итоговая оценка;

Введение нечетких характеристик может помочь преподавателям разрабатывать тесты. Например, преподаватель может достаточно быстро определить, является ли задание сложным или нет. Но сказать точно, насколько оно сложно, например, по 100-бальной шкале или точно оценить разницу сложностей двух заданий будет для него достаточно трудно. С точки зрения обучаемого нечеткая оценка его знаний в виде «хорошо», «отлично», «не очень хорошо» и т.п. более понятна ему, чем четкое количество баллов, которое он набрал в результате тестирования.

Модели могут быть комбинированными, например:

Классическая модель с учетом сложности заданий и модель с учетом времени ответа на задание;

Модель с возрастающей сложностью и модель с учетом времени ответа на задание;

Модель с возрастающей сложностью и модель с ограничением времени на тест;

Модель с учетом времени ответа на задание и адаптивная модель;

Модель с учетом времени ответа на задание и модель на нечеткой математике;

Модель с разделением заданий по уровням усвоения и модель с учетом сложности заданий;

3 . Разработка тестовых заданий

3.1 Создание компьютерного тестирования

Компьютерный тест - инструмент, предназначенный для измерения обученности учащегося, состоящий из системы тестовых заданий в электронном виде, определённой процедуры проведения, обработки и анализа результатов. Компьютерный тест формируется программным способом из электронного банка тестовых заданий в соответствии со спецификацией (планом, паспортом теста).

Систематическая проверка знаний большого числа проверяемых приводит к необходимости автоматизации проведения тестирования знаний, использованию компьютерной техники и соответствующих программ проверки знаний.

Компьютерное тестирование как эффективный способ проверки знаний находит в образовании все большее применение. Одним из его достоинств является минимум временных затрат на получение надежных итогов контроля, и получение результатов практически сразу по завершении контролирующего теста. От традиционных оценок и контроля знаний - тесты отличаются объективностью измерения результатов обучения, поскольку они ориентируются не на субъективное мнение преподавателей, а на объективные критерии.

Главные требования к системе компьютерного контроля заключаются в том, что:

Тестовые вопросы и варианты ответов на них должны быть четкими и понятными по содержанию;

Компьютерный тест должен быть простым в использовании;

Тестовых вопросов должно быть настолько много, чтобы совокупность этих вопросов охватывала весь материал, который обучающийся должен усвоить;

Вопросы должны подаваться испытуемому в случайном порядке, чтобы исключить возможность механического запоминания их последовательности;

Варианты возможных ответов должны следовать так же в случайном порядке;

Необходимо проводить учет времени, затраченного на ответы, и ограничивать это время.

Был создан тест для проверки знаний студентов физического факультета по дисциплине специализации «Допуски, посадки и технические измерения». Опрос в форме тестирования проводится в течение 15 минут и включает в себя 15 вопросов, которые последовательно предъявляются студенту в автоматизированном режиме. Во время тестирования на экране монитора располагается только одно тестовое задание.

Каждый студент имеет право пройти тест только один раз. По истечении 15 минут компьютерная программа автоматически завершает процедуру тестирования и выдает на экран монитора итоговый результат.

Во время тестирования переговоры между студентами не разрешаются. С вопросами, не касающимися содержания учебного материала, следует обращаться к преподавателю или администратору компьютерного класса, предварительно подняв руку, чтобы не отвлекать других испытуемых во время тестирования.

Наличие учебных и справочных материалов во время сеанса тестирования не допускается. Выходить из компьютерного класса во время сеанса тестирования не разрешается.

Для компьютерного тестирования была использована программа «Краб 2», в которой случайным образом из 50 вопросов выбирается 15 и предлагаются студенту. На каждый вопрос дается по 4 варианта ответа. Правильными может быть от одного до трёх ответов.

Рисунок 1 - Пример вопроса с одним правильным ответом

Рисунок 2 - Пример вопроса с несколькими правильными ответами

При тестировании допускается пропускание вопроса, возвращение к предыдущему вопросу, а также своевременное завершение теста. Результат тестирования выводится на экран при завершении теста. Указывается количество правильных, неправильных и пропущенных ответов. По завершению теста можно посмотреть все задания, на который студент дал неверный ответ.

Рисунок 3 - Результат тестирования

3.2 Тестовые задания

1. Качество изделия следует рассматривать:

a. на протяжении всего «жизненного цикла»;

b. на этапе изготовления;

c. на этапе эксплуатации;

d. нет правильного ответа

2. Термин, условно применяемый для обозначения наружных элементов деталей, включая и нецилиндрические элементы:

a. отверстие;

b. вал;

d. шарнир.

3. Размер элемента, установленный измерением:

a. наименьший предельный размер;

b. номинальный;

c. предельный размер;

d. действительный размер.

Какая схема изображена на представленном рисунке

b. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

d. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

4. Какая схема изображена на представленном рисунке:

схемы посадок в системы основного отверстия;

b. поля допусков с разными основными отклонениями и уровнями относительной точности;

5. Какая схема изображена на представленном рисунке:

a. схемы посадок в системы основного отверстия;

b. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

c. поля допусков с разными основными отклонениями и уровнями относительной точности;

d. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

6. Какая схема изображена на представленном рисунке:

схемы посадок в системы основного отверстия;

a. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

b. поля допусков с разными основными отклонениями и уровнями относительной точности;

c. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

7. Какие калибры обеспечивают контроль по наибольшему и наименьшему придельным значениям параметров:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

8. Калибры, предназначенные для контроля деталей в процессе их изготовления:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

9. Калибры, предназначенные для контроля рабочих калибров-скоб:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

10. Допуск формы - это:

a. нормативные ограничения отклонения формы назначенными полями допусков;

b. характеристики любой реальной поверхности;

c. прямолинейность осей поверхности вращения;

d. прямолинейность цилиндра и конуса.

11. Какие виды взаимозаменяемости различают:

a. функциональная;

b. алгебраическая;

c. геометрическая;

d. полная.

12. К суммарным отклонениям формы и расположения относятся:

a. торцовое биение;

b. заданное биение;

c. радиальное биение;

d. нормальное биение.

13. Условный знак допуска плоскости выглядит:

a. ;

14. Условный знак допуска формы заданной поверхности:

c. ;

15. По каким классам точности установлены общие допуски размеров:

a. последний, средний;

b. нормальный, точный;

c. точный, средний;

d. грубый, очень грубый.

16. Какое обозначение имеет шариковый радиальный подшипник:

a. 0;

17. Какое обозначение имеет шариковый радиальный сферический подшипник:

b. 1;

18. Какое обозначение имеет роликовый радиальный с витыми роликами подшипник:

d. 5.

19. Какое обозначение имеет шариковый радиально-упорный подшипник:

c. 6;

20. Основными достоинствами резьбовых соединений являются:

a. усложнение конструкции;

b. легкая сборка;

c. высокий уровень взаимозаменяемости изделий;

d. усложнение технологии.

21. Основными недостатками резьбовых соединений являются:

a. усложнение конструкции;

b. легкая сборка;

c. высокий уровень взаимозаменяемости изделий;

d. усложнение технологии.

22. Для метрических резьб стандартизированы:

a. профиль резьбы;

b. номинальные диаметры и шаги;

c. нормы точности;

d. нет правильного ответа.

23. В зависимости, от каких характеристик функционирования различают резьбовые соединения:

a. неподвижные;

b. подвижные;

c. стандартные;

d. нестандартные.

24. Качество измерений, отражающее близость к нулю систематических погрешностей и их результат:

a. правильность измерений;

b. сходимость измерений;

d. нормальность измерений.

25. Качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в одинаковых условиях:

a. правильность измерений;

b. сходимость измерений;

c. воспроизводимость измерений;

d. нормальность измерений.

26. Качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в различных условиях:

a. правильность измерений;

b. сходимость измерений;

c. воспроизводимость измерений;

d. нормальность измерений.

27. Какой взаимозаменяемости полная взаимозаменяемость предполагает наличие:

a. полная;

b. неполная;

c. начальная;

d. конечная.

28. Предельный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

29. Действительный размер это:

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

30. Номинальный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

31. Наибольший предельный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

32. Действительное отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

33. Предельное отклонение это:

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

34. Верхнее отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

35. Нижнее отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

36. Основное отклонение это:

a. одно из двух предельных отклонений определяющее положение поля допуска относительно нулевой линии;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

37. Квалитет - это:

c. совокупность допусков, рассматриваемых как соответствующие одному уровню точности для всех номинальных размеров;

38. Допуск - это:

a. поле, ограниченное наибольшим и наименьшим предельными размерами и определяемое величиной допуска и его положением относительно номинального размера;

b. разность между наибольшим и наименьшим предельным размерами или алгебраическая разность между верхними и нижними отклонениями;

d. отверстие, нижнее отклонение которого равно нулю.

39. Поле допуска - это:

a. поле, ограниченное наибольшим и наименьшим предельными размерами и определяемое величиной допуска и его положением относительно номинального размера;

b. разность между наибольшим и наименьшим предельным размерами или алгебраическая разность между верхними и нижними отклонениями;

c. совокупность допусков, рассматриваемых как соответствующие одному уровню точности для всех номинальных размеров;

d. отверстие, нижнее отклонение которого равно нулю.

40. Основное отверстие - это:

a. поле, ограниченное наибольшим и наименьшим предельными размерами и определяемое величиной допуска и его положением относительно номинального размера;

b. разность между наибольшим и наименьшим предельным размерами или алгебраическая разность между верхними и нижними отклонениями;

c. совокупность допусков, рассматриваемых как соответствующие одному уровню точности для всех номинальных размеров;

d. отверстие, нижнее отклонение которого равно нулю.

41. Характер соединения двух деталей, определяемый разностью их размеров до сборки:

a. допуск;

b. посадка;

42. Разность между размерами отверстия и вала до сборки, если размер отверстия больше размера вала:

a. допуск;

b. посадка;

c. зазор;

43. Разность между размерами вала и отверстия до сборки, если размер вала больше размера отверстия:

a. допуск;

b. посадка;

d. натяг.

44. Разность между наибольшим и наименьшим предельными размерами или алгебраическая разность между верхним и нижним отклонениями:

a. допуск;

b. посадка;

45. Наименьший зазор - это:

a. разность между наименьшим предельным размером отверстия и наибольшим предельным размером вала в посадке с зазором;

46. Наибольший зазор - это:

b. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

c. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

47. Посадка с натягом - это:

a. разность между наименьшим предельным размером отверстия и наибольшим предельным размером вала в посадке с зазором;

b. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

c. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

d. разность между наибольшим предельным размером вала и наименьшим предельным размером отверстия до сборки в посадке с натягом или в переходной посадке.

48. Наименьший натяг - это:

a. разность между наименьшим предельным размером отверстия и наибольшим предельным размером вала в посадке с зазором;

b. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

c. наименьший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

d. разность между наименьшим предельным размером вала и наибольшим предельным размером отверстия до сборки в посадке с натягом.

49. Наибольший натяг - это:

a. разность между наибольшим предельным размером вала и наименьшим предельным размером отверстия до сборки в посадке с натягом или в переходной посадке;

b. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

c. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

d. разность между наименьшим предельным размером вала и наибольшим предельным размером отверстия до сборки в посадке с натягом.

Заключение

Тестирование является одним из основных видов проверки знаний, как во время вступительной комиссии в высшее учебное заведение, так и в процессе обучения. Этот метод проверки знаний позволяет давать оценку беспристрастно, системно, объективно и достаточно быстро, исключая субъективные особенности экзаменатора.

В курсовой работе были рассмотрены основные модели тестовых заданий (классический, адаптивный, с учетом времени, с учетом сложности), их достоинства и недостатки. Так же было разработано компьютерное тестирование для проверки знаний у студентов физического факультета по темам: «Допуски, посадки и технические измерения».

Тестовые задания познавательны для обучающихся, они способствуют развитию интереса к предмету и повышают качество знаний. Обучающиеся с разным уровнем подготовки чувствуют себя психологически комфортно при проведении теста. Тестовые задания способствуют развитию мышления, учат сопоставлять и сравнивать, анализировать и делать выводы, планировать дальнейшую деятельность.

На основе материала данной курсовой работы можно сказать, что использование тестов для проверки знаний студентов является надежным и перспективным методом и может широко использоваться и в дальнейшем.

Список использованных источников

знание тестовый задание

1. Социологический справочник / под ред. В.И. Воловича. - Киев, 1990. - 379 с.

2. Социологический словарь / сост.: А.Н. Елсуков, К.В. Шульга. - Мн., 1991. - 528 с.

3. Фонд времени и мероприятия в социальной сфере / под ред. В.Д. Патрушева. - М.: Наука, 1989. - 176 с.

4. Беспалько, В.П. Системно-методическое обеспечение учебно-воспитательного процесса подготовки специалистов / В.П. Беспалько, Ю.Г. Татур - М.: «Высшая школа», 1989. - 144 с.

6. Глова, В.И. Мягкие вычисления (soft computing) и их приложения / В.И. Глова, И.В. Аникин, М.А. Аджели. - Казань: 2000. - 98 с.

Подобные документы

    История возникновения тестирования. Понятие теста, тестовых заданий. Классификация тестов, основные формы тестирования. Закрытые и открытые тестовые задания. Задания на соответствие и установление правильной последовательности. Анализ систем тестирования.

    презентация , добавлен 07.04.2014

    Особенности организации тестирования знаний. Рекомендации по использованию тестовых заданий на разных этапах обучения и в различных видах занятий, оценка их результатов. Анализ роли и места тестовых заданий по истории в проверке знаний и умений учащихся.

    курсовая работа , добавлен 30.08.2010

    Значение проверки знаний учащихся по биологии. Классификация тестовых заданий. Основные формы и методы проверки знаний и умений учащихся. Использование тестовых заданий для текущей и итоговой проверки. Обучение учащихся работе с тестовыми заданиями.

    курсовая работа , добавлен 17.03.2010

    Педагогическое тестирование в России и за рубежом. Исторические предпосылки современного тестирования в отечественном образовании. Классификация видов педагогических тестов, предтестовых заданий и требования к ним. Инновационные формы тестовых заданий.

    курсовая работа , добавлен 28.10.2008

    Использование электронных систем управления обучением. Формирование банка тестовых заданий всех основных форм. Матрица результатов тестовых заданий. Индекс легкости заданий для тестируемой группы. Средства анализа результатов тестовых заданий системы.

    реферат , добавлен 31.03.2011

    Цель проведения и методы оценочной процедуры. Составление контрольно-измерительных материалов для итоговой аттестации по технической механике. Структуризация банка заданий. Оценка результатов тестирования. Экспертиза и апробация банка тестовых заданий.

    дипломная работа , добавлен 25.05.2014

    Качественные экспертно-ориентированные методы оценки знаний и умений учащихся. Цель и основные задачи тестирования. Основные виды тестовых заданий. Функции теста и основные этапы его разработки. Сквозное применение педагогами метода тестирования.

    курсовая работа , добавлен 27.12.2011

    История проверки знаний и способностей с помощью различных заданий. Опыт централизованного абитуриентского и репетиционного тестирования в России. Тесты в американской системе образования. Характерные черты тестовых методов, используемых в Америке.

    реферат , добавлен 05.02.2008

    Методологические основы создания тестовых заданий, их особенности, класификация, критерии качества, экспертиза. Проверка в тестовых заданиях законов сохранения энергии, сохранения импульса и сохранения момента импульса.

    дипломная работа , добавлен 29.07.2011

    Теоретико-методические основы тестовых заданий и его видов. Психолого-педагогические основы. Тесты на уроках математики. Анализ опыта учителей по применению тестовых заданий. Краткая характеристика преимуществ использования тестовой формы контроля.

ных затратах, чем свободный опрос. 3. Тесты являются специализированными методами психодиагностического обследования, применяя которые можно получить точную количественную или качественную характеристику изучаемого явления. От других методов исследования тесты отличаются тем, что предполагают четкую процедуру сбора и обработки первичных данных, а также своеобразие их последующей интерпретации. С помощью тестов можно изучать и сравнивать между собой психологию разных людей, давать дифференцированные и сопоставимые оценки. Варианты теста: тест – опросник и тест-задание. Тест-опросник основан на системе заранее продуманных, тщательно отобранных и проверенных с точки зрения их валидности и надежности вопросов, по ответам на которые можно судить о психологических качествах испытуемых. Тест-задание предполагает оценку психологии и поведения человека на базе того, что он делает. В тестах этого типа испытуемому предлагается серия специальных заданий, по итогам выполнения которых судят о наличии или отсутствии и степени развития у него изучаемого качества. Тест-опросник и тест-задание применимы к людям разного возраста, принадлежащим к различным культурам, имеющим разный уровень образования, разные профессии и неодинаковый жизненный опыт. Это - их положительная сторона. А недостаток состоит в том, что при использовании тестов испытуемый по желанию может сознательно повлиять на получаемые результаты, особенно если он заранее знает, как устроен тест и каким образом по его результатам будут оценивать его психологию и поведение. Кроме того, тест-опросник и тест-задание неприменимы в тех случаях, когда изучению подлежат психологические свойства и характеристики, в существовании которых испытуемый не может быть полностью уверен, не осознает или сознательно не хочет признавать их наличие у себя. Такими характеристиками являются, например, многие отрицательные личностные качества и мотивы поведения. В этих случаях обычно применяется третий тип тестов - проективные. В основе таких тестов лежит механизм проекции, согласно которому неосознаваемые собственные качества, особенно недостатки, человек склонен приписывать другим людям. Проективные тесты предназначены для изучения психологических и поведенческих особенностей людей, вызывающих негативное отношение. Применяя тесты подобного рода, о психологии испытуемого судят на основании того, как он воспринимает и оценивает ситуации, психологию и поведение людей, какие личностные свойства, мотивы положительного или отрицательного характера он им приписывает. Пользуясь проективным тестом, психолог с его помощью вводит испытуемого в воображаемую, сюжетно неопределенную ситуацию, подлежащую произвольной интерпретации. Такой ситуацией может стать, например, поиск определенного смысла в картинке, где изображены неизвестно какие люди, непонятно, чем занятые. Нужно ответить на вопросы, кто эти люди, чем они озабочены, а чем думают и что произойдет дальше. На основании содержательной интерпретации ответов судят о собственной психологии отвечающих. Тесты проективного типа предъявляют повышенные требования к уровню образованности и интеллектуальной зрелости испытуемых, и в этом состоит основное практическое ограничение их применимости. Кроме того, такие тесты требуют большой специальной подготовки и высокой профессиональной квалификации со стороны самого психолога. Сегодня тесты - это наиболее широко используемый метод психологического исследования. Все же необходимо отметить тот факт, что тесты занимают проме- жуточное положение между субъективными и объективными методиками. Это обусловлено большим разнообразием тестовых методик. Существуют тесты, ос- нованные на самоотчете испытуемых, например тесты-опросники. При выполнении данных тестов испытуемый может сознательно или неосознанно повлиять на результат тестирования, особенно если он знает, как будут интерпретироваться его ответы. Но существуют и более объективные тесты. К их числу прежде всего необходимо отнести проективные тесты. Данная категория тестов не использует самоотчеты испытуемых. Они предполагают свободную интерпретацию исследователем выполняемых испытуемым заданий. Например, по наиболее предпочтительному для испытуемого выбору цветовых карточек психолог определяет его эмоциональное состояние. В других случаях испытуемому предъявляют картинки с изображением неопределенной ситуации, после чего психолог предлагает описать события, отраженные на картинке, и на основе анализа интерпретации испытуемым изображенной ситуации делается вывод об особенностях его психики. Однако тесты проективного типа предъявляют повышенные требования к уровню профессиональной подготовки и опыту практической работы психолога, а также требуют наличия достаточно высокого уровня интеллектуального развития у испытуемого.

← Вернуться

×
Вступай в сообщество «passport13.com»!
ВКонтакте:
Я уже подписан на сообщество «passport13.com»