2000: Ромек В.Г., Сатин Д.К. Сохранение надежности многофакторных тестов при их использовании в сети интернет

// Психологический Журнал, 2000, том 21, № 2, с. 70-75

©2000г. В. Г. Ромек*, Д. К. Сатин** 
* Канд. психол. наук., преподаватель Южно-Российского гуманитарного института, Ростов-на-Дону
** Ассоциированный научный сотрудник Института Психологии РАН, аспирант факультета психологии МГУ, координатор проекта PSYCHOLOGY.RU, Москва

Выявлено сохранение показателей надежности многошкальных тестов, разработанных с применением факторного анализа при их использовании в сети Интернет. Рефакторизация данных, полученных по тестам уверенности в себе и Айзенка (EPI) на больших выборках (661 и 1637 человек), доказала, что надежность тестов при их использовании в сети Интернет не уменьшается при сохранении факторной структуры тестов. В то же время, усредненные значения по шкалам при тестировании в сети отличаются от данных, полученных на "бланковых" выборках. Авторы делают вывод о возможности использования тестов в сети, но оговаривают необходимость дальнейшего анализа специфики выборок пользователей сети Интернет.

Ключевые слова: факторная структура теста, психометрические характеристики теста, надежность, компьютерное тестирование.

ЦЕЛИ, ЗАДАЧИ, ГИПОТЕЗЫ

Глобальная компьютерная сеть Интернет все в большей степени осваивается специалистами-психодиагностами в качестве новой среды для организации и проведения исследований [4-6]. Компьютерная сеть предоставляет несколько возможностей, которые отсутствуют при бланковом тестировании, а именно:

  • низкую стоимость тиражирования материалов;
  • широкий географический охват;
  • не требуется непосредственного присутствия психодиагноста рядом с испытуемым. Инструкцию и стимульный материал предоставляет программный комплекс, осуществляющий также обработку полученных данных. Ее результаты автоматически соотносятся с психометрическими нормами, на основании чего испытуемому выводится текст интерпретации;
  • пользователи компьютерной сети подготовлены к встрече с тестами, так как для получения обратной связи многие администраторы сети создают и размещают на своих серверах непсихологические опросники-анкеты. Каждый пользователь имеет опыт участия в опросах, предъявляемых в виде одностраничной анкеты или последовательности диалогов. У пользователей глобальной сети достаточно высока готовность к участию в тестировании еще и потому, что многие администраторы сайтов размещают на них популярные, а зачастую и профессиональные тесты в качестве развлекательного материала.

Особенности профессионального тестирования в глобальной сети ставят перед диагностами ряд проблем этического, практического и научного плана. Тестирование в сети происходит в отсутствие психолога, который мог бы проконтролировать ход диагностической процедуры, и от которого испытуемый получает интерпретацию результатов. Это ставит перед диагностом дополнительные задачи контроля переменных, связанных с ситуацией тестирования, а также задачу составления таких интерпретаций, которые бы не оставляли испытуемому возможностей для неверного истолкования.

Процесс заполнения формы на экране компьютера, или прохождение последовательности диалогов, существенно отличается от традиционной работы с карандашом и бумагой. Испытуемый может отвлекаться, одновременно выполнять какую-либо другую работу в открытой программе, он может, наконец, просто случайным образом заполнить тест, чтобы посмотреть, что в итоге получится.

В связи с этим возникает ряд важных для психодиагностики задач:

  • в технических средствах реализовать те функции, которые обычно выполняет психолог, проводя тестирование испытуемого (в психологии накоплен значительный опыт проведения тестов на персональных компьютерах, но тестирование в сети Интернет требует новых решений, позволяющих стандартизировать эту ситуацию);
  • проверить надежность психологических тестов при их использовании в сети Интернет с автоматической обработкой данных и выдачей рекомендаций.

Настоящее исследование направлено на решение второй из перечисленных выше задач. В ходе исследования обсуждаются основные подходы к решению первой задачи.

ХАРАКТЕРИСТИКИ ВЫБОРОК

Тест уверенности в себе

Выборка 1 (бланковое тестирование) составила 535 человек (60.6% женщин, 39.4% мужчин). Она включала испытуемых с разным образовательным уровнем (в ней не было студентов-психологов). Тестирование проводилось частично в групповой форме, основная масса бланков была заполнена испытуемыми в ходе консультационной работы. Все испытуемые получали интерпретацию результатов тестирования.

Выборка 2 (тестирование в сети Интернет) составила 661 человек (53.6% женщин, 46.4% мужчин). Контролировать иные демографические показатели выборки не представлялось возможным. Тестирование проходило на сайте "Психология уверенности в себе" путем заполнения формы, по внешнему виду приближенной к бумажному бланку. Интерпретация либо рассылалась по электронной почте, либо выводилась на экран компьютера.

Тест Айзенка

Выборка 3 (бланковое тестирование) составила 153 человека (студенты МГУ обоего пола непсихологических специальностей).

Выборка 4 (тестирование в сети Интернет) составила 1637 человек (46% женщин, 54% мужчин). Тестирование проходило на сайте "Книжная полка научно-психологической литературы" путем прохождения испытуемым последовательных диалогов, в каждом из которых нужно выбрать один из двух вариантов ответа. После осуществления выбора программа автоматически предъявляла испытуемому новый пункт опросника. После ответа на последний пункт опросника программа автоматически выводила испытуемому интерпретацию его результатов.

Для всех выборок, полученных при тестировании в сети Интернет, собирались также данные о возрасте испытуемых. Разброс значений составил от 12 до 54 лет, при значении медианы - 25 лет.

МЕТОДИКА

Мы сопоставили надежность двух тестов - уверенности в себе и личностного опросника Айзенка при их использовании в бланковой форме и при выполнении теста анонимными пользователями в сети Инернет.

Это сопоставление должно было дать ответ на вопрос, требуется ли дополнительная адаптация тестов при их использовании в сети, т.е. происходит ли изменение надежности и других психометрических характеристик при тестировании в сети Интернет, и существует ли разница между нормами при выполнении бланковых тестов и их версий в сети Интернет?

Тест Айзенка (Eysenck Personality Inventory, EPI) особого представления специалистам не требует. Он содержит три шкалы: Экстраверсии, Нейротизма, Лжи [I]. Для сравнения использовалась его русская адаптация (форма А), выполненная А.Г. Шмелевым [7], и данные о нормах и составе шкал [2].

Тест уверенности в себе представляет собой опросник из 30 пунктов, разработанный с использованием факторного анализа и дающий оценки по шкалам общей уверенности в себе, социальной смелости и инициативы в контактах [3].

Для проверки зависимости психометрических характеристик названных тестов от ситуации тестирования (бланковое или тестирование в сети Интернет) мы сравнили на двух выборках по каждому тесту факторные структуры, показатели надежности отдельных шкал (а-Кронбаха) и нормы, полученные при бланковом тестировании и тестировании в сети Интернет.

РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ

Полученные данные обрабатывались по одной и той же схеме с использованием статистического пакета SPSS-7.5. На первом этапе мы сравнили факторные веса отдельных пунктов теста уверенности в себе по трем его шкалам на двух описанных ранее выборках. Результаты сравнения мы приводим в табл. 1.

Как можно увидеть из этой таблицы, в целом в факторной структуре теста не произошло существенных изменений, за исключением вопроса № 191, что гипотетически можно объяснить преимущественно ночным образом жизни тех, кто тесно связан с работой в Интернете (ночью - дешевле и связь лучше). Именно во второй выборке (Интернет) мы получили значимо меньше ответов "неверно" на этот вопрос2.

Таблица 1. Факторные веса вопросов теста уверенности при тестировании в бланковой форме и в сети Интернет


вопроса
Факторные веса
фактор 1
социальная
смелость/застенчивость
фактор 2
уверенность в себе
фактор 3
инициатива
в социальных контактах
23 .622/.570    
2 .589/.599    
14 .582/.420    
5 -.580/-.491    
8 .578/.518   .277/-
29 .566/.544    
11 .561/.623 -265/-.290  
17 .518/.573    
26 .514/.457    
10 .495/.429   .364/.319
20 .491/.546    
16 .368/.326 -356/-.271 .251/.263
24   .675/.635  
21   -.594/-.647  
12   .547/.620  
9   .537/.573  
30   .534/.599  
6   .515/.498  
18   .479/.329 .272/-
3   .439/.529  
15   .428/.364  
27 .299/.309 -400/-.516  
22     .555/.613
1     .555/.557
28     .521/.416
4     .474/.469
25     .434/.589
13 .327/.381   .422/.313
7 .265/.266 -323/-.373 .364/-
19     -.242/-

Примечание. Факторный анализ проводился с экстракцией факторов методом главных компонент и последующей Varimax-ротацией. В таблице приводятся факторные веса после ротации. Первая цифра соответствует факторному весу, полученному на "бланковой" выборке, вторая - при тестировании в сети Интернет. В таблице приводятся факторные веса, большие, чем 0.25.

Соответственно, можно было ожидать сохранения хорошего уровня надежности при тестировании в сети. Мы проверили это предположение, рассчитав индексы надежности на двух выборках. Как видно из табл. 2, надежность всех трех шкал теста уверенности при тестировании в сети либо уменьшилась крайне незначительно, либо даже, увеличилась (шкала уверенности).

Были также проверены различия в средних значениях по трем шкалам на двух выборках. По всем трем шкалам обнаружены значимые различия средних между двумя выборками (а < 0.01). Дисперсия значимо различалась лишь по шкале общей уверенности (а = 0.03). Означает ли это, что нормы при тестировании в сети должны быть пересмотрены?

Таблица 2. Сравнение индексов надежности теста уверенности при тестировании в бланковой форме и в сети Интернет

Шкалы Индексы надежности (а-Кронбаха)
Уверенность в себе 0.73/0.75
Социальная смелость 0.79/0.77
Инициатива 0.60/0.56

Примечание. Первая цифра соответствует коэффициенту, полученному на "бланковой" выборке, вторая - при тестировании в сети Интернет.

Полученные различия могут быть объяснены разным характером мотивации тестирования у испытуемых при проведении бланкового варианта и при проведении в сети Интернет. В случае бланкового тестирования мотивация участия в тестировании варьирует от ориентации на получение интерпретации до желания помочь исследователю в осуществлении стандартизации теста. При проведении тестирования в сети Интернет мотивация тестирования ограничена мотивацией самопознания, так как исследователь не имеет никакого влияния на поведение испытуемого. Приходится также признать, что сам выбор методики испытуемым может быть не случаен. Вполне может оказаться, что люди, испытывающие недостаточность, например, уверенности в себе, чаще проходят тест уверенности в себе, чем самоуверенные. Подобному искажению состава подвержены те тесты, в названии которых указана измеряемая ими психологическая черта.

Таблица 3. Факторные веса вопросов теста Айзенка при тестировании сети Интернет

№ вопроса /
№ шкалы 
в ключах 1984 г.
Факторы
экстраверсия нейротизм ложь
23/2 .621    
55/2 .621 -.124 .157
16/2 .608    
09/2 .608    
52/2 .566 -.118 -.141
07/2 .547    
14/2 .546    
38/2 .538   -.210
47/2 .534   -.151
33/2 .517   .130
19/2 .504   -121
50/2 .498   -.152
40/2 .492    
11/2 .451 -.131  
02/2 .446 .270  
26/2 .427 .269  
31/2 .366    
45/2 .355   -.144
35/2 .336    
04/2 .336 -.126  
28/2 .307    
43/2 .302    
57/2 .295    
37/1(-) .264 -.143 .114
21/2 .210 .133  
18/3(-) .201   -.135
22/1 .196 .168 -.165
17/1   .645  
49/1 -.113 .628  
27/1 -.143 .606  
25/1 -.127 .545  
53/1 -.126 .526 .111
29/1(-) .179 -.512 .110
15/1(-)   -.509  
46/1 .186 .468  
51/1(-) .158 -.444  
39/1 -.113 .424 .156
01/1 .106 .417  
56/1   .387 -.202
20/1(-) .118 -.384 .156
32/1(-)   -.339  
44/1   .326 .110
10/1   .308  
08/1 .135 .290  
13/1 .151 .282  
03/1 -.171 .277  
41/1(-) .107 -.168 .147
05/1(-)   -.123  
06/3     .537
24/3   .271 .506
54/3(-)   .159 -.481
36/3     .441
42/3(-)     -.433
12/3(-) .294   -.391
48/3(-)     -.381
30/3(-) .206 .199 -.373
34/1     .370

Примечание. Результаты факторного анализа после Varimax-ротации. Факторные веса отсортированы в нисходящем порядке. Показаны факторные веса, большие чем 0.1. В первом столбце после номера вопроса следует номер шкалы, в которую вошел данный вопрос в результате адаптации 1984 г. В скобках отмечена полярность вопроса.

Соответствующие расчеты для теста Айзенка при его использовании в сети Интернет дали схожие результаты. В факторном анализе мы установили практически полное соответствие факторной структуры теста ключам к тесту, которые разработаны А.Г. Шмелевым в процессе его адаптации. Как это можно увидеть из табл. 3, несмотря на то, что русская адаптация проводилась в бланковом варианте в 1984-85 гг., при тестировании в Интернете с последовательным предъявлением вопросов испытуемым группировка отдельных вопросов теста практически не изменилась. Лишь единичные вопросы имели большие факторные веса в "неправильном" факторе, что, однако, не сказалось на надежности шкал теста в целом. Расчеты надежности по отдельным шкалам теста также дали достаточно хорошие результаты (табл.4).

Таблица 4. Оценка надежности шкал теста Айзенка при тестировании в сети Интернет

Шкалы Индексы надежности
(a-Кронбаха)
Экстраверсия 0.75
Нейротизм 0.85
Ложь 0.53

 

Таблица 5. Показатели ретестовой надежности, полученные при тестировании в сети Интернет

Тест Айзенка (EPI, форма А)
Шкала rxy Пирсона
Экстраверсия-Интроверсия 0.878
Нейротизм 0.877
Социальная желательность 0.772
Тест уверенности в себе
Шкала rxy Пирсона
Социальная смелость 0.972
Инициатива в социальных контактах 0.962
Уверенность в себе 0.982

Примечание. Уровень значимости для всех полученных значений произведения моментов Пирсона составил р < 0.01. Повторное тестирование, проходившее через две недели после проведения первого, по тесту Айзенка прошли 64 испытуемых, а по тесту уверенности в себе - 74.

Следует отметить, что, конечно, самым большим достоинством проведения тестирования в сети Интернет является возможность получения больших выборок, без которых проблематично разработать достаточно точную психодиагностическую методику. На малых выборках (от 100 до 200 человек), которые обычно набираются при бланковой стандартизации, невозможно выявить важные характеристики, необходимые для оценки точности и эффективности методики. Примером такого уточнения данных, полученных при бланковой стандартизации больших выборок в сети Интернет, является установление фактов чувствительности шкалы нейротизма теста Айзека к полу испытуемых и неоднородности шкалы экстраверсии-интроверсии [6].

Учитывая бурное развитие сети Интернет в России, работа по проведению психодиагностических исследований в сети представляется очень важной и перспективной. Она может стать важным стимулом дальнейшего развития отечественной психодиагностики.

ВЫВОДЫ

Таким образом, на примере теста уверенности в себе и теста Айзенка обнаружено сохранение основных психометрических характеристик многошкальных тестов, построенных с применением факторного анализа при их использовании в сети Интернет. Следовательно, правомерно сделать вывод о том, что надежность психологических тестов этого типа не снижается. Вопрос о необходимости дополнительного нормирования остается открытым, но глобальная компьютерная сеть предоставляет огромные возможности для научного исследования этой проблемы. При тестировании в сети психолог может получить уникальный материал, так как есть возможность составления больших выборок, равномерно распределенных на определенной территории. Размещение тестов на разных сайтах и в разных вариантах позволит изучить зависимость норм и надежности тестов от содержания сайтов, на которых они размещены, от вариантов программирования и предъявления испытуемым заданий теста.

По окончании данного исследования была осуществлена разработка универсальной системы проведения психодиагностических исследований в сети Интернет (http://testology.psychology.ru). Система предоставляет зарегистрированным пользователям возможность прохождения в стандартизованных условиях ряда исследовательских методик и получения интерпретации результатов.

Уже сейчас система позволила собрать данные о ретестовой надежности тестов, которым посвящена данная работа (табл. 5).

СПИСОК ЛИТЕРАТУРЫ

  1. Бурлачук Л.Ф., Морозов СМ. Словарь-справочник по психодиагностике. Киев: "Наукова Думка", 1989. С. 8-11.
  2. Практикум по психодиагностике. Психодиагностические материалы / Под ред. А.А. Бодалева, И.М. Карлинской, С.Р. Пантилеева, В.В. Столина. М.: Изд-во МГУ, 1988. С. 11-16.
  3. Ромек В.Г. Тесты уверенности в себе // Практическая психодиагностика и психологическое консультирование. Ростов-на-Дону: Изд-во ЮРГИ, 1998. С. 87-108.
  4. Ромек В.Г., Сатин Д.К. Психологическое тестирование в сети Интернет: проблемы надежности тестов // Научный сервис в сети Интернет. Тезисы докладов всероссийской научной конференции. М.: Изд-во МГУ, 1999. С. 226-229. ISBN 5-211-04181-X.
  5. Ромек В.Г., Сатин Д.К. Надежность тестов при тестировании в Интернете // Междисциплинарный семинар "Виртуальная коммуникация в сети Интернет". М., 1999. С. 27-36.
  6. Сатин Д.К. Психометрические нормы личностного опросника Айзенка (EPI) при проведении в сети Интернет // Индивидуальный и групповой субъекты в изменяющемся обществе. Тезисы докладов к международной научно-практической конференции. М.: ИП РАН, 1999. С. 136-138. ISDN 5-201-02314-2.
  7. Шмелев А.Г., Похилько В.И. Анализ пунктов при конструировании и применении тест-опросников: ручные и компьютерные алгоритмы // Вопросы психологии. 1985. № 4. С. 126-134.

RELIABILITY INDICES OF MULTISCALE TESTS WHEN APPLIED IN THE INTERNET

V. G. Romek*, D. K. Satin** 
*Cand. Sci (psychology), URGI, Rostov-on-Don 
**Associated scientific employee of Institute of Physhology RAS, post-graduate student ofthe department ofpsychology MSU, coordinator of project PSYCHOLOGY.RU, Moscow.

The paper displays invariability of reliability indices of multiscale tests elaborated by means of factor analysis when applied in Internet.

Refactorization of Assertiveness and Eysenck (EPI) tests data obtained on great samples (661 and 1637 respondents accordingly) proved that reliability of these tests when applied in Internet does not decrease; their factor structure retains. At the same time mean scores of scales testing obtained in Internet differ from the data of "blank" samples. The authors state the possibility of applying psychological tests in Internet while focussing on the necessity of further exploration of the peculiarities of Internet samples.

Key words: factor structure of tests, psychometric characteristics, internal consistency, computer based testing, Internet based testing.

 


1. "Если мне срочно нужен мой друг, то я звоню ему даже поздно ночью". 
2. Вопрос в суточном распределении частоты тестирования в сети Интернет был дополнительно изучен. Оказалось, что с 00:00 до 09:00 проходят тестирование не более 20% испытуемых, а с 03:00 до 07:00 - меньше 8%. Учитывая то, что в сетевом тестировании принимают участие испытуемые, живущие в разных часовых поясах, фактором возможностей искаженности результатов ночного тестирования можно пренебречь.

Типы материалов: