Кточке зрения Ф. Лорда присоединяются Кэттелл и Клайн [17]. По их мнению, максимум валидности может быть получен тогда, когда все задания слабо, но положительно коррелируют друг с другом, при этом каждое из них имеет высокую корреляцию с критерием по тесту. Поэтому повышению валидности способствует включение заданий, для которых характерны большие коэффициенты бисериальной корреляции с суммой баллов по тесту.
При количественных оценках валидности для педагогических тестов в качестве критерия обычно берутся оценки экспертов, выставленные ими при традиционной проверке знаний учеников без использования тестов. Процесс валидизации осложняется необходимостью установления меры согласованности оценок экспертов, которых обычно бывает не менее трех. Если мера согласованности достаточно высока, то для оценки валидности используется формула
где Х i – Х̅ – отклонение тестового балла i -го ученика от среднего балла по тесту; Х тi – Х̅ э — отклонение балла i -го ученика у экспертов от Х̅ э — среднего арифметического экспертных оценок; S X 2 — дисперсия баллов учеников по тесту; S mx 2 — дисперсия баллов экспертов; m — число экспертов.
Бывают случаи, когда педагог заинтересован в оценке прогностической валидности, например, указывающей меру вероятности прогноза успешности профессиональной деятельности выпускника вуза по результатам выполнения теста. В этом случае результаты по тесту коррелируют с результатами аттестации молодых специалистов, проводимой на предприятиях и организациях в течение нескольких первых лет работы. Высокая корреляция означает, что разработанные тесты прогностичны для отбора лучших выпускников вуза, обладающих сформированными профессиональными компетенциями.
В отличие от традиционных средств контроля тесты проходят процесс научного обоснования качества, предполагающий оценку соответствия характеристик тестов двум важнейшим критериям: надежности и валидности. Разработка тестов для принятия административно-управленческих решений в образовании требует длительного исследовательского периода, охватывающего в циклическом режиме все этапы создания теста.
Анализ эмпирических данных тестирования начинается с построения матрицы, отражающей взаимодействие испытуемых и заданий в процессе выполнения теста. Обработка данных матрицы в классической теории тестов основывается на дескриптивной статистике, анализ результатов обработки позволяет оценить качество тестовых заданий и всего теста.
Наибольшую трудность при создании теста представляет интерпретация результатов обработки эмпирических результатов тестирования, но только благодаря ей может быть достигнуто высокое качество теста. Полная стандартизация процедуры предъявления теста способствует повышению точности и созданию качественных тестов.
Для разработки аттестационных тестов в вузе рекомендуется использовать традиционную теорию тестов.
Практические задания и вопросы для обсуждения
В таблице приведены ответы 30 испытуемых на одно задание теста. Всех испытуемых можно разбить на две подгруппы, одна из которых содержит 15 испытуемых высокого уровня подготовленности, а другая – 15 человек низкого уровня подготовленности (сильная и слабая группа). По данным таблицы вычислите:
1 ) среднее значение тестовых баллов по сильной и по слабой группе, сравните их;
2) дисперсию баллов по всей группе (30 испытуемых);
3 ) долю правильных ответов на задание по сильной группе ( 15 испытуемых);
4) долю правильных ответов на задание по слабой группе (15 испытуемых);
5 ) корреляцию между ответами испытуемых на задание и суммой баллов по тесту для сильной группы;
6 ) корреляцию между ответами испытуемых на задание и суммой баллов по тесту для слабой группы.
7. Сертификация аттестационных тестов
7.1. Общие сведения о системе сертификации педагогических тестов
Источники повышения валидности теста:
• подбор оптимальной трудности заданий для обеспечения нормального закона распределения баллов по тесту;
Читать дальше