Приведенные матрицы позволяют интерпретировать компоненты как индикаторы использования определенных пространственных стратегий, которые используются испытуемыми в разной степени. Первая компонента может быть интерпретирована как показатель приверженности стратегии «не использовать горизонтальные переходы и использовать вертикальные». Вторая компонента – как показатель приверженности стратегии «использовать вертикальные переходы в правой нижней части матрицы Равена».
Обучение модели представления закономерностей. Значения выделенных факторов и значения целевых переменных, чья взаимная изменчивость является предметом анализа и интерпретации, используются для обучения модели распознавания образов (модели-классификатора или модели регрессии).
Обучение модели заключается в настройке ее параметров таким образом, чтобы получаемые предсказания значений целевой переменной отличались от реальных измеренных значений как можно меньше в терминах используемой меры ошибки. Освещение тех или иных алгоритмов обучения предсказательных моделей, равно как и подходов к оценке ее обобщающей (предсказательной) способности (напр., методика скользящего контроля), подробности методов распознавания образов и такого научного направления, как машинное обучение, можно уточнить, например, в соответствующих изданиях (Воронцов, 2007; Лепский, Броневич, 2009; Alpaydin, 2010).
Обученная модель в случае высокой степени ее предсказательной способности может успешно использоваться для предсказания значений целевых переменных: как дискретных категорий испытуемых (таких как, напр., индикатор правильности выполненного задания теста способностей, пол испытуемого, уровень навыка чтения), так и соответствующих им непрерывных случайных величин (таких, напр., как возраст, итоговый балл по тесту).
Интерпретация модели. Обученная и надежная модель представления закономерностей часто может быть легко интерпретирована путем определения входных переменных, учитываемых при принятии решения в первую очередь (или с большим весом). Например, такие модели, как деревья решений, обобщенная линейная модель или дискриминантная модель, не только способны решать задачу предсказания значения целевой переменной, но и позволяют трактовать прогноз в терминах предметной области путем анализа структуры модели и ее идентифицированных параметров.
В случае деревьев решений объяснение может строиться путем выписывания последовательности условий, проверенных для данного испытуемого на пути от корня дерева до листа. Эти условия образуют конъюнкцию, т. е. легко интерпретируемое логическое правило (Воронцов, 2007). Пример дерева, построенного с использованием выборки значений интерпретированных выше главных компонент SR-матриц и предсказывающего успешность выполнения задания теста Равена, приведен на рисунке 5.
Рис. 5. Дерево классификации, позволяющее правильно (в 70 % случаев) предсказывать результат выполнения задания («Выполнил верно» – «Pass» и «Выполнил неверно» – «NotPass») по величинам главных компонент «Horis» («He использовать горизонтальные переходы и использовать вертикальные») и «Vertic» («Использовать вертикальные переходы в правой нижней части матрицы Равена»)
В целом данное дерево можно интерпретировать следующим образом: если испытуемый придерживается определенных стратегий глазодвигательной активности, то скорее всего задания теста Равена будут пройдены успешно. Однако, если испытуемый зацикливается при рассмотрении элементов матрицы задания по углам, т. е. в верхней левой либо в нижней правой частях, то, вероятно, он не может установить зависимость между элементами матрицы задания и само задание пройдено не будет.
В случае применения линейных регрессионных моделей или дискриминантных функций выявление значимых объясняющих признаков также не составляет труда (достаточно воспользоваться подходящими статистическими критериями значимости коэффициентов модели), а их интерпретация зависит от абсолютной величины коэффициента и знака при нем.
Заключение
В ходе проекта было разработано программное обеспечение, позволяющее психологу проводить анализ экспериментальных данных видеоокулографии с помощью рассмотренного метода статистического анализа и методов выделения информативных признаков (в том числе и скрытых), не имея при этом глубоких познаний ни в математике, ни в программировании, точнее, при минимальных познаниях в данных областях. На данный момент на языке R (R Core Team, 2014) программно реализованы (автор – Борислав Поляков, выпускник факультета информационных технологий МГППУ):
Читать дальше
Конец ознакомительного отрывка
Купить книгу