А.Н. Майоров определяет целый ряд факторов, оказывающих влияние на надежность тестового инструментария

1. Величина теста. Чем длиннее тест, тем он надежнее. Выше отме­чалось, что общая оценка теста состоит из истинной составляющей и ошибочной. Истинная составляющая, несомненно, больше ошибочной, и чем больше заданий в тесте, тем скорее сумма истинной составляющей будет возрастать, а ошибочной, соответственно, уменьшаться.

2. Непонятность и двусмысленность заданий. Непонятные и дву­смысленные задания приводят к тому, что ответы на них даются случай­ным образом. То есть в двух тестированиях будут получены разные резуль­таты, таким образом, корреляция между результатами тестирований сни­зится и, следовательно, надежность будет низкой.

3. Источники, связанные с испытуемыми: невнимательность, со­стояние здоровья и т.д. Все эти факторы снижают надежность тестирова­ния. Однако в том случае, когда выборка для апробации теста достаточно велика, а инструкция для проведения четко определяет условия проведе­ния, то многого из перечисленного удается избежать.

4. Субъективное оценивание. Результаты выполнения заданий должны оцениваться одинаково разными проверяющими. Другими словами, правиль­ный ответ в тесте должен быть однозначным. В том случае, если это требова­ние будет нарушено, то будут допускаться различия между оценками разных проверяющих и между оценками одного проверяющего в разных случаях. Как следствие различных оценок корреляция между результатами выполнения тестирования будет уменьшена и надежность теста будет невысокой.

5. Ошибки в подсчетах. В том случае, если задания имеют однознач­ную схему оценивания, причиной неудовлетворительной надежности мо­гут стать случайные ошибки при подсчете баллов, их суммировании.

6. Инструкции для учащихся. В том случае, если задания имеют не­ясные, двусмысленные инструкции, то результаты двух тестирований бу­дут существенно различаться, а надежность окажется невысокой.

7. Инструкции к тесту могут быть причиной низкой надежности. Ин­струкции должны обеспечивать одинаковость процедуры проведения тес­тирования, быть понятными и недвусмысленными. Если условия проведе­ния тестирования в одном случае отличаются от другого, то и корреляция результатов тестирования в этих случаях будет невысокой.

 

Вопрос 4. Оценка критериальной валидности теста. Конструктивная валидность теста. Содержательная валидность теста.

 

Одной надежности для обоснования качества теста недостаточно. Еще одной важнейшей характеристикой теста является его валидность. Валид­ность - понятие, которое указывает, что и насколько хорошо тест измеряет. Цель процедуры установления валидности - выявить, как выполнение тес­та соотносится с другими независимо наблюдаемыми фактами исследуе­мых характеристик поведения или качеств личности. Отечественные и зарубежные исследова­тели различают три основных вида валидности: валидность по содержа­нию, конструктивная и критериальная валидность.

Критериальная валидность теста - характеристика теста, которая говорит о том, в какой мере данный тест можно использовать для оценки успеваемости учащегося. Если речь идет о тестах достижений, то критери­альная валидность определяется тем, в какой мере результаты данного теста могут быть использованы для выводов об успеваемости испытуемо­го. Существует несколько видов эмпирических данных, на основании кото­рых можно подтвердить критериальную валидность теста:

• оценки учащегося, его место в списке класса, ранжированность по успеваемости;

• результаты других тестов;

• отзывы педагогов.

Конструктивная валидность теста - гарантия, что тест измеряет то качество, которое имеет реальное психологическое содержание. Интеллект, самоуважение и креативность - примеры таких психологических конструк­тов. Свидетельства в пользу конструктивной валидности теста могут принимать самые различные формы. Один из подходов состоит в том, чтобы показать, что результаты выполнения заданий, составляющих один тест, взаимозависимы, и, следовательно, в ходе тестирования измеряется одно и то же качество. Для проверки существования связи между заданиями часто используют методы ана­лиза корреляций и факторного анализа. Другой подход состоит в том, чтобы показать, что тест ведет себя так, как должно было бы вести себя измеряемое качество. Например, можно предполагать, что результаты теста на креативность будут сильнее коррелировать с результатами теста на художественную одарен­ность, чем с результатами теста на академическую успеваемость.

Содержательная валидность теста - степень, в которой задания те­ста отражают содержание определенной предметной области. О содержа­тельной валидности теста обычно судят по плану теста и методам, которые используются при его разработке. Для определения данного вида валиднос­ти уместно задаться следующими вопросами. Была ли разумна процедура отбора, призванная обеспечить включение в тест нужного материала? Обес­печивает ли эта процедура возможность судить по выполнению отобранных заданий об уровне знаний испытуемого в данной области и овладении им специфическими для данной области навыками?

 

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: