Разработка тестов
Тестология
Прежде всего, необходимо обрисовать цель, ради которой вообще затевается оценка и анализ тестовых заданий. В прошлом выпуске нашей рассылки упоминался основной принцип конструирования теста - максимальное отражение всех параметров свойства через минимальное количество заданий. Ничего лишнего. Анализ тестовых заданий призван именно для устранения "сорняков".
Анализ и оценка тестовых заданий начинается после апробации теста на целевой группе. Полученные данные сводятся в таблицу с матричной структурой, в которой задания начинают сортироваться по следующим критериям.
Мера трудности задания
Мера трудности задания дает информацию о степени задействования того параметра изучаемого свойства, которое оно призвано измерять. Иногда говорят, что мера трудности определяет соответствие задания целевой группе теста. В целом, можно сказать, что данный критерий позволяет судить и об этом.
Трудное задание или легкое, определяют путем подсчета доли неправильных ответов к каждому из них. Однако сегодня применяется и не совсем классический способ определения трудности задания - умозрительно, на основе предполагаемого числа и характера тех элементов, которые участвуют в выполнении задания (и входят в параметр измеряемого свойства). Допустим, в тесте на объем памяти присутствует задание, связанное с произвольным запоминанием, в котором могут участвовать речь (проговаривание списка цифр вслух или "про себя"), мышление (построение ассоциативных связей) и т.п. В этом случае задание на запоминание числового ряда с отвлеканием испытуемого может повысить трудность его выполнения.
Дифференцирующая способность
Дифференцирующая способность задания - насколько оно может отличить сильного испытуемого от слабого по измеряемому свойству. Если по одному из заданий у всех испытуемых имеется одинаковое значение - это задание нецелесообразно включать в тест. Очень сложно не сделать ошибку и не принять дифференцирующую способность задания за его трудность / легкость. Дело в том, что в тестах, измеряющих качество выполняемой деятельности, знаний и т.п., тестах достижений, ряд одинаковых ответов на задание будет означать два варианта: правильно / неправильно. Соответственно, по этому ряду можно сделать неверный вывод о трудности (в случае всех неправильных ответов) или легкости (в случае всех правильных ответов) задания.
Необходимо заметить, что данным критерием часто пренебрегают составители современных тестов. Это приносит большие неудобства и испытуемым, которым приходится отвечать на лишние вопросы, и психологам, которые вынуждены обрабатывать лишнюю информацию.
Дифференцирующая способность эмпирически определяется через вариацию данных.
Вариация и дисперсия
Вариация - буквально, степень разнообразия данных, полученных при выполнении задания. Она отражает дифференцирующую способность. Если дифференцирующая способность высокая, мы говорим о вариативных данных, и наоборот. При невариативных данных задание удаляют из теста. Определяется вариация путем вычисления дисперсии. Дисперсия вычисляет сумму квадратных отклонений значений баллов от среднего арифметического балла. Проще говоря, рассчитывается среднее арифметическое по выборке, и все полученные значения баллов начинают с ним сравниваться. Таким образом, мы получаем информацию о вариации тестового задания. Общепринятой мерой вариации тестовых баллов задания является стандартное отклонение, которое определяется путем вычисления квадратного корня из дисперсии.
Иногда вариацией называют наблюдаемую переменную величину. Дело в том, что то свойство, на измерение которого направлен тест, принимается за латентную (ненаблюдаемую) переменную. А с помощью теста определяется наблюдаемая переменная, которая выявляет лишь приближенные значения ненаблюдаемых истинных баллов испытуемого.
Первичный анализ результатов тестирования
Итак, тест стандартизован, апробирован, одобрен экспертной комиссией. Теперь с помощью него можно получать необходимую информацию о психологическом свойстве или способности человека. Для этого после проведения тестирования проводят первичный анализ результатов. Обычно о нем говорят в случае группового тестирования.
Полученные данные сначала необходимо свести к среднему значению. Оно более наглядно показывает групповой результат. Однако среднее значение мало информативно в отношении характеристики распределения значений баллов, частоты встречаемости каждого значения. Мода (Мо) - показатель наиболее часто встречающегося значения балла. Мод может быть несколько - наибольшее количество раз могли встретиться несколько значений. Далее выборку делят пополам, а значения баллов пограничного испытуемого принимаются за медиану (Ме).
График результатов теста обычно принимает форму колокола ("колокол Гаусса"), отвечая закону о нормальном распределении, где крайние значения показывают редко встречающиеся баллы, а при приближении к середине кривой частота встречаемости баллов увеличивается. Моды, медиана и среднее арифметическое значение также откладываются на графике. В некоторых случаях они могут совпадать - тогда распределение данных называют симметричным. Чем больше расстояние между модой, медианой и средним значением, тем больше результаты теста отклоняются от нормального распределения.
Преимущества компьютерных программ тестирования
Вышеописанная процедура обработки тестовых результатов при большом количестве испытуемых отнимает много времени и сил. Компьютерные программы тестирования позволяют за считанные секунды увидеть вышеназванные характеристики выборки, для большей наглядности представленные на графиках и в таблицах. Это экономит время, деньги и силы психолога, который, сразу получив результаты первичного анализа, может приступать к разработке рекомендаций или проверке научных гипотез.
Компьютерные программы Effecton Studio - это широкий выбор тестов на различные свойства и способности человеческой личности. Сюда входят тесты на свойства внимания, памяти, восприятия, мышления, коммуникативных способностей (опросник Томаса, тест Лири), а также тесты на личностные особенности (Кеттел, Айзенк). Программы Effecton Studio также дают возможность быстрой и качественной обработки полученных данных.
Ольга Данилова.