Модель имеет две основные версии: мультипликативную и аддитивную.
В соответствии с этой моделью правильность решения теста определяется либо высоким уровнем развития способности, либо низким уровнем трудности задания.
В специальной литературе описаны компьютерные алгоритмы и программы, позволяющие на основе эмпирических результатов рассчитать как объективную трудность задания, так и «способность» каждого испытуемого [2, 3].
Сам Г. Раш использовал свою модель при создании критериальных тестов и ввел единицу измерения, называемую логит, которая измеряет в одной шкале как трудность задания, так и способность испытуемого.
В. С. Аванесов [4] предложил использовать несколько модификаций модели Раша: модель, учитывающую вероятность угадывания правильного ответа, и более сложную модель, учитывающую влияние на успешность решения теста других способностей.
Как бы там ни было, интуитивно психологи при создании тестов всегда строили задания таким образом, чтобы они варьировали по трудности и были направлены на измерение не более чем одной способности.
Третий этап конструирования теста является этапом отбраковки непригодных заданий, а не творческим процессом их создания. Но именно этот этап традиционно считается конструированием теста. Для него разработан весь существующий в настоящее время аппарат эмпирико-статистической теории теста, предназначенный для оценки валидности и надежности теста и отдельных его заданий.
Процедура валидизации и проверки на надежность, гомогенность (однородность), дифференцирующую силу, прогностичность и т. д. сводится к отбору заданий теста и представляет собой итерационную процедуру доведения теста до требуемого уровня качества за счет замены заданий, их модификации, а также изменения процедуры проведения и интерпретации данных тестирования.
Все существующие тесты интеллекта можно условно разделить на две группы: 1) тесты «скорости» и 2) тесты «уровня». Если при проведении первых вводится жесткий лимит времени, то при проведении вторых, хотя и есть ограничение времени выполнения теста или субтеста, но главную трудность для испытуемого составляют особенности заданий. Встречаются варианты тестов, где используются оба вида затруднений.
Тесты «скорости» представляют собой несколько однотипных и близких по уровню сложности заданий. Испытуемый должен решить их за определенное время. Показателем успешности служит число правильно решенных заданий. Уровень сложности их должен быть близок 0,5, то есть задание решает правильно половина людей выборки, на которой проверяется тест.
В тестах «уровня», как уже было отмечено, время, которое дается испытуемому, значительно превышает время, необходимое среднему испытуемому для решения теста. Создатель теста всегда полагает, что испытуемый, не справившийся с заданием за отведенное время, не решит его никогда. В качестве «измерительной линейки интеллекта» в тестах «уровня» используется шкала сложности тестового задания.
Главное затруднение вызывает оценка сложности задания. Согласно модели Раша, сложность оценивается экспериментально, следовательно, имеет статистический характер. Кроме того, возникает необходимость установить: 1) минимально необходимое число заданий для каждого уровня сложности, 2) необходимое число уровней сложности, 3) достоверность различий оценок сложности заданий, принадлежащих разным уровням.
Эти проблемы решены в работе Ф. М. Юсупова [5], который предложил вероятностную модель прогнозирования параметров теста «уровня». Расчеты показывают, что в тестовом задании целесообразно брать от 6 до 10 вариантов ответа, чтобы минимизировать вероятность случайного решения.
Число заданий в тесте уровня не должно быть слишком велико для того, чтобы значения показателей сложности соседних по уровню сложности заданий надежно различались. Кроме того, нужно учесть, что правильный ответ может быть выбран испытуемым случайно.
При 6 вариантах ответа в каждом тестовом задании количество заданий не может быть более 6-7 (см. табл. 3).
Модель, предложенная Ф. М. Юсуповым, позволяет спрогнозировать минимальный объем выборки, достаточной для стандартизации теста.
Соответствующая модель для расчета параметров теста с эквивалентными по трудности заданиями (тест «скорость») предложена в работе В. Н. Дружинина [6].
Эмпирически проверка теста интеллекта на валидность и надежность – процедура стандартная и хорошо отражена в методических руководствах [1].
Читать дальше
Конец ознакомительного отрывка
Купить книгу