Цикл проведения расчета
Основные этапы анализа данных психологических экспериментов
Проведение расчета в программе Менеджер профилей - это путь из нескольких простых шагов по выбору данных, которые следует включить в расчет и действий, которые нужно провести над ними. Каждый из шагов этого пути фактически полностью соответствует какой-либо из секций дерева расчета.
Выбор испытуемых.
Выбор активностей.
Ввод данных вручную, если нужно.
Выбор параметров (столбцов).
Выбор статистических функций.
Настройка внешнего вида документа.
Далее в этом параграфе, рассмотрим весь процесс с высоты птичьего полета, а последующие части этой главы будут посвящены деталям каждого из описанных шагов и некоторым другим частным вопросам.
Выбор испытуемых
Ограничить набор профилей испытуемых, данные из которых войдут в расчет, можно путем добавления условий в дерево расчета. Например, если нужно включить в расчет только данные по испытуемым из класса "9Б", выполните следующие действия:
Рис. 44: Добавление условий в секцию испытуемых.
Щелкните ссылку "добавить условие...".
В выпадающем меню, выберите пункт "группа".
В открывшемся редакторе условия на название группы, введите "9Б".
Нажмите кнопку "Ок". Условие должно быть добавлено в дерево.
Заметим по поводу данной секции следующее:
- кроме условия "группа", в выпадающем меню представлены и другие типы условий на профили пользователей, включаемых в расчет: возраст испытуемых, пол, дата регистрации в системе и другие. Более того, модель данных является расширяемой, т.е. выбор данных можно осуществлять также и по любым [дополнительным параметрам], которыми были аннотированы профили - например, по номеру школы, району, показателям академической успеваемости и т.д.
- для того, чтобы наиболее полно определить условия на выбор данных, в секции профилей можно формировать составные условия, объединяя условия в группы. Более подробно о работе с группами элементов дерева расчета говорится в одноименном параграфе далее.
- для того, чтобы назначенные условия работали корректно, важно, чтобы соответствующим образом были заполнены профили пользователей. Это относится, например, к правильности ввода биографических данных в момент регистрации профиля в системе. Данные по отдельным профилям, можно также изменять и пополнять в режиме просмотра профилей Менеджера профилей.
Выбор активностей
Достаточно часто требуется включить в расчет данные только по тем испытуемым, которые прошли определенные активности. Например, если исследователя интересуют данные по испытуемым, которые прошли тест на объем внимания, можно выполнить следующие действия:
Рис. 45: Добавление условий в секцию активностей.
Щелкнуть сслыку "добавить условие..."
Выбрать пункт меню "есть результаты для..."
Откроется диалоговое окно, в главной части которого расположено дерево, содержащее названия пакетов, а внутри пакетов вложены входящие в его состав тесты. Поскольку нас в данном случае интересует тест на объем внимания, нам следует развернуть пакет "Внимание" и выделить тест "Объем внимания (Разведчик)".
Щелкнуть кнопку "Ок" - в дереве запроса добавится вновь созданное условие.
Заметим, что список возможных условий включает в себя также условия на выбор испытуемых, не прошедших какой-либо активности, условия на длительность активности, на процент ее завершенности, даты прохождения, а также на значения параметров, полученных в результате прохождения какой-либо активности.
При этом, также как и для секции профилей испытуемых, условия в секции активностей, можно объединять в группы для того, чтобы более точно формировать требуемые наборы данных расчета.
Правила выбора данных
- При формировании набора данных расчета, условия на выбор активностей и испытуемых пересекаются. Т.е. для того, чтобы данные попали в расчет, они должны удовлетворять условиям обоих секций одновременно.
- Если в секции испытуемых нет ни одного условия - это означает, что в расчет будут включены данные из всех имеющихся профилей, которые удовлетворяют условиям из секции активностей.
- В подавляющем большинстве случаев, психолога интересуют именно наборы данных по испытуемым, имеющим записи об определенных активностях в профиле пользователей. Поэтому условия о прохождении той или иной активности почти всегда присутствуют в секции активностей.
- Добавленные условия можно редактировать, щелкнув по названию условия мышкой. В этом случае откроется диалоговое окно, соответствующее данному условию.
Выбор столбцов
Совокупность условий из секции пользователей и секции активностей позволяет локализовать те профили испытуемых, из которых, согласно запросу, требуется выбрать данные для расчета. Секция столбцов указывает какие из свойств этих профилей запрос должен вернуть.
Так, в нашем примере, первыми двумя секциями мы задали условие о получении данных для всех испытуемых из класса "9Б", которые проходили тест "разведчик". Профили этих пользователей могут содержать различную информацию, избыточную для целей расчета. Например, личные сведения испытуемых, их адреса, телефоны или результаты прохождения многих других активностей.
Очевидно, что подавляющая часть этих данных нас не интересуют при проведении конкретного исследования. Предположим, что для нашего исследования, нам нужно вывести имена и фамилии испытуемых, а также балльную оценку и дату прохождения активности.
Рассматривая процесс добавления столбцов на примере фамилии пользователя, выполним следующие действия:
Щелкнем на ссылке "добавить столбец" в секции столбцов.
Поскольку мы хотим добавить поле "фамилия", которое является свойством пользователя, выбираем пункт "с параметрами пользователя..."
В открывшемся диалоговом окне выбираем "Фамилия".
После нажатия "Ок", в списке столбцов дерева расчета появится вновь добавленный столбец.
Аналогичным образом, добавляем другие столбцы, которые требуются для нашей задачи, т.е. "имя", "возраст", "балльная оценка" по тесту разведчик и "дата прохождения" этого теста.
Очевидно, что для того, чтобы иметь возможность получить хоть какие-то данные в таблицу, нужно выбрать хотя бы один запрос в секции столбцов.
Рис. 46: Добавление столбца с данными о пользователе группу столбцов.
Выполнение запроса к данным
На следующем рисунке видно, что к данному моменту мы заполнили только три секции расчета - секции пользователей, активностей и столбцов. Текст дерева расчета можно прочитать как запрос на естественном языке "для пользователей из группы "9Б", в профиле которых имеются результаты по тесту "Разведчик", показать столбцы "Имя", "Фамилия", "Возраст", "Балльная оценка" и "Дата прохождения".
Очевидно, что сформулированного запроса достаточно для того, чтобы программа точно знала какие именно данные мы хотим получить в таблицу. Даже без проведения каких-либо статистических расчетов, формирование правильного набора данных является достаточно полезной функцией. Для того, чтобы осуществить запрос, нужно
Нажать кнопку "Выполнить" на панели инструментов.
Нажать кнопку "Да" в диалоговом окне подтверждения о перезаписи таблицы данных.
Если условия запроса в дереве расчета сформулированы правильно и в базе данных присутствуют данные, которые удовлетворяют этим условиям, то таблица расчета будет заполнена требуемыми данными.
Рис. 47: Выполнение запроса к данным на основе условий дерева расчета.
Ввод данных вручную
Помимо данных, которые хранятся в базе данных профилей, в расчет можно также включить данные из других источников. Это могут быть, например, данные, собранные в результате прохождения бланковых тестов или данные об академической успеваемости учащихся.
Давайте добавим к полученной на прошлом шаге таблице дополнительный столбец, под названием "Оценка по физике", а также значения этой оценки.
В секции столбцов, щелкнем ссылку "добавить столбец...".
В выпавшем меню, выберем пункт "содержащий ручной ввод".
В открывшемся диалоговом окне, введем "Оценка по физике" - название столбца.
В отличии от столбцов с параметрами пользователя или активности, в данном типе столбца, мы не можем выбрать какой-либо источник данных, поэтому просто закрываем окно при помощи кнопки "Ок".
Мы видим, что последним столбцом в таблице добавился столбец "Оценка по физике". Единственное, что нам остается сделать - это ввести имеющиеся значения с клавиатуры. Во время ввода, поведение табличного редактора практически полностью повторяет поведение программы Microsoft Excel.
Рис. 48: Добавление столбца ручного ввода и заполнение его данными.
Замечания по поводу столбцов ручного ввода:
- Введенные вручную данные не привязываются к данным, полученным в результате запроса. Т.е., если произвести команду "Выполнить", после того, как база данных изменилась, то данные введенные вручную, хоть и останутся в запросе, могут утратить соответствие данным запроса по строкам.
- Вы можете в любой момент сохранить текущее состояние расчета на диск и данные сохранят тот же вид и соответствие по строкам.
- Данные ручного ввода можно добавить в качестве дополнительных свойств в профили пользователя при помощи Менеджера профилей. В этом случае, при запросах они будут сохранять привязку к профилям испытуемых, что предоставит большую гибкость для статистического анализа.
- Порядок следования столбцов в таблице можно изменить при помощи команд перемещения элементов из контекстного меню элементов дерева расчета.
- В качестве альтернативы описанной здесь процедуры, для добавления нового столбца ручного ввода, можно перейти в самый левый столбец таблицы, не заполненный другими данными и произвести прямой ввод данных в ячейки. В этом случае, описание столбца в дереве расчета добавится автоматически, причем его название будет совпадать с заголовком этого столбца, указанного в таблице.
Выбор статистических функций
После того, как запрос данных настроен и столбцы таблицы заполняются значениями, исследователь может расчитать статистические величины. Статистические формулы, встроенные в программу, являются групповыми, т.е. работают над наборами значений. В простейшем случае, в качестве наборов значений используются столбцы, что вполне согласуется с логикой, поскольку столбцы выводят параметры профилей пользователей или активностей.
Обращая внимание исключительно на принципы работы, а не статистическую правомерность описываемых вычислений, покажем как рассчитать коэффициент корреляции. Сделаем это на начатом ранее примере для учеников 9Б класса, прошедших тест "разведчик".
Рис. 49: Добавления формулы для расчета коэффициента корреляции между столбцами "Возраст" и "Балльная оценка".
Щелкаем ссылку "добавить формулу..." в секции формул дерева расчета.
Выбираем пункт "коэффициент корреляции" из выпадающего списка формул.
В открывшемся редакторе коэфициента корреляции, указываем, что данная формула работает со столбцами "Возраст" и "Балльная оценка". Для этого, ставим галочки напротив соответствующих столбцов. Остальные столбцы являются затененными, потому что тип этих столбцов не позволяет использовать их значения для непосредственных расчетов.
Подтверждаем наши настройки, нажав кнопку "Ок".
В списке формул на панели сводки расчета появляется только что добавленная нами формула.
Каждая формула содержит иконку, соответствующую типу формулы, ее название и описание входных параметров. В правой части формулы приводится результат ее вычисления. Для формул, вычисляющих коэффициент корреляции и достоверность разницы между средними, над численным значением формулы, может также наблюдаться одинарный или двойной символ "*", который показывает степень достоверности значений.
Аналогичным способом, можно также добавить расчет других функций. Заметим, что количество выделенных столбцов, должно соответствовать количеству входных параметров функции, которое, вообще говоря, различно для разных функций.
Значения формулы пересчитываются автоматически, когда в соответствующих ей данных происходят какие-либо изменения. Для пересчета формул не требуется нажимать кнопку "Выполнить".
Расчет формул не зависит от того каким образом были получены данные - из запроса к базе или введены вручную. Единственным ограничением является то, что для использования в расчете формул, введенные вручную столбцы должны содержать числовые данные. В противном случае, расчет по таким столбцам может не привести к успеху.
Группировка строк таблицы
В предыдущем пункте был рассмотрен случай, когда в качестве входных параметров формул использовались столбцы целиком. Некоторые типы расчетов требуют более точного разделения данных. Для этого, помимо исходного разделения по столбцам, можно организовать еще и вертикальное разделение данных на основе значений в столбцах.
Для наложения условий на эти значения, используется секция "группы" дерева профилей. Рассмотрим, например, формирование групп на нашем примере. Попробуем сгруппировать данные по классам.
В секции условий на профили испытуемых, снимем условие на принадлежность классу "9Б". Заметим, что для этого не обязательно удалять само условие - достаточно просто снять крестик слева от него. Поскольку теперь это условие не учитывается, когда мы обновим расчет, в таблицу будут выведены данные по всем испытуемым, которые прошли тест "разведчик".
Для того, чтобы иметь возможность группировать данные по значениям группы, нужно включить этот столбец в расчет. Для этого, добавим соответствующий столбец в секции столбцов. Для определенности, присвоим этому столбцу название "Класс".
Обновим данные расчета, нажав кнопку "Выполнить".
Добавим новую группу в секции "группы" дерева расчета, щелкнув по ссылке "добавить..." и выберем "группу", назовем группу "9Б". Затем добавим в эту группу условие, щелкнув "добавить..." и выбрав "условие". В тексте условия введем "9Б". Аналогичным образом, добавим группу "9В" и соответствующее условие для нее.
Результирующая таблица будет иметь вид, показанный на рисунке ниже.
Обратите внимание на группу с названием "Основная". Эта группа присутствует в списке по умолчанию и содержит все записи, которые не попадают в другие группы (в нашем примере, в эту группу попали ученики класса "9Г").
Если расчет не содержит условий в секции групп, все записи считаются принадлежащими "основной" группе, но ее заголовок не отображается в таблице. При желании, записи этой группы, также как и любой другой, можно скрыть из таблицы, убрав крестик слева от названия группы в дереве расчета.
Рис. 50: Внешний вид таблицы, значения в которой разбиты на группы в соответствии с условиями в секции "группы", установленные в дереве расчета.
Разбив таблицу данных на требуемое количество групп, можно вычислить значения статистических функций, используя в качестве аргумента интересующие части столбцов. В этом случае, в диалоговом окне настройки формул, нужно отмечать не столбцы, а отдельные группы внутри столбцов.
Заметим здесь, что все изменения условий в дереве расчета, которые требуют перезагрузки данных, изменяют таблицу только команде "выполнить". Если же изменения касаются только отображения данных, такие как спрятать или показать какой-либо столбец или произвести какую-либо группировку, то изменения происходят сразу же после редактирования условий в дереве.
Настройка документа
Представление в виде таблицы может быть достаточно удобным в случае, когда нужно изменять значения в ячейках, добавлять данные, изменять формат столбцов, проводить другие операции. Когда дело доходит до обмена результатами расчетов, более удобным является представление в виде документа. Рассмотрим в общих чертах работу с документом на примере нашего расчета.
Рис. 51: Внешний вид документа и основные принципы его настройки.
Также как и в случае работы с профилями пользователей, переход в режим документа осуществляется при помощи закладки "Документ" в верхней части окна программы. Документ формируется автоматически в соответствии с текущими свойствами расчета.
Более детальная настройка внешнего вида документа осуществляется при помощи секции "свойства", которая находится в самой верхней части дерева расчета. Элементами данной секции являются части расчета, которые участвуют в формировании документа. Щелкнув по крестику слева от названия элемента, его можно исключить из документа. Так, в примере на рисунке, мы исключили вывод секции запроса, на основании которого были получены данные.
Настройки каждой части можно также варьировать в широких пределах, щелкнув по названию элемента секции "Свойства". На рисунке показан пример редактирования "подписи" - элемента, который обычно выводится в нижней части страницы.
Чтобы применить изменения, внесенные в диалоговом окне редактирования элемента свойства документа, нажмите кнопку "Ок".
Внешний вид документа обновляется соответствующим образом сразу после изменения свойств.
Аналогичным образом, можно настроить внешний вид заголовка документа, описания, запроса, таблицы данных, формул, ввести интерпретацию расчета. Порядок следования элементов в документе можно изменить при помощи команд перемещения элементов из контекстного меню дерева расчета.
При формировании таблицы в документе, внешний вид последней будет, где это возможно, повторять настройки таблицы в режиме редактирования. В первую очередь это относится к видимости столбцов, групп, а также цветов и шрифтов оформления.
Взаимосвязь элементов управления
Если состояние элементов дерева расчета и хранящихся в них значений изменяются, то состояние данных в других элементах расчета изменяется соответствующим образом. Некоторые изменения отражаются синхронно с внесением их в дерево. Это относится, например, к операциям включения или выключения видимости определенного столбца, изменению порядка столбцов или изменению какой-либо формулы, вычисляемой на основании данных, уже полученных запросом.
Некоторые другие изменения дерева могут повлечь необходимость повторения запроса к базе данных, что может занять заметное время и, кроме того, нарушить существующий набор данных. В этом случае автоматического запроса не производится. Эти изменения пользователь осуществляет самостоятельно при помощи кнопки "выполнить" на панели инструментов после того, как настройки запроса к данным закончены.
Если пользователь производит редактирование таблицы и оно затрагивает основные свойства проекта, то узлы дерева изменяются соответствующим образом. Например, если скрыть один из столбцов в форме, снимется соответствующая галочка напротив определения этого столбца в дереве, или если начать ввод данных в свободный столбец, в дерево добавится его определение.