1 МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ ХАРЬКОВСКИЙ НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТ ИМЕНИ В.Н.КАРАЗИНА УДК 159. 9. 072 (075) ББК 88. 492 Я 7 Л 19 Печатается по решению ученого совета факультета психологии Харьковского национального университета имени В. Н. Каразина (протокол №7 от 24.03.2006). Рецензенты: доктор психологічних наук, професор, завідувач кафедри практичної психології Харківського національного педагогічного університету ім. Г. С. Сковороди Хомуленко Т. Б. кандидат психологічних наук, доцент кафедри прикладної психології Харьковского национального университета имени В. Н. Каразина Крейдун Н. П. ЛАКТИОНОВ А.Н., ЛУЦЕНКО Е.Л. ОСНОВЫ ПСИХОДИАГНОСТИКИ, ПСИХОМЕТРИИ И ТЕСТОЛОГИИ: УЧЕБНО-МЕТОДИЧЕСКОЕ ПОСОБИЕ. – Х.: ХНУ ІМЕНІ В. Н. КАРАЗІНА, 2006. – 64 С. В данном учебно-методическом пособии рассматриваются вопросы истории и современного состояния психодиагностики. Подробно описаны принципы, методы и приемы создания тестов. Приведены многочисленные примеры корректного использования тестов в различных сферах психологического знания. Пособие может быть использовано студентами-психологами университетов, специалистами, заинтересованными вопросами разработки и применения методов психодиагностики. © Харьковский национальный университет имени В.Н.Каразина, 2006. © Лактионов А.Н., Луценко Е.Л., 2006. Содержание 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. Введение…………………………………………………………………………………………………………..……..….….…..2 Предмет психодиагностики. Психодиагностика в сфере прикладной психологии………………………..…….…..….……..2 История психодиагностики…………………………………………………………………………………….…….…...…….…3 Современные проблемы психодиагностики………………………………………………….………….………….….……..….4 Принципы психодиагностики. Этические аспекты………………………………………………….…………………………...4 Классификация тестов…………………………………………………………………………………………….….…..…..…....5 Этапы создания теста……………………………………………………………………………………………..…..…..…..…...6 Исходная гипотеза. Теоретический конструкт………………………………………………………………..………..….….....6 Истинный показатель. Репрезентативность заданий теста……………………………………………………..………..…......8 Репрезентативность выборки испытуемых…………………………………………………….…………………………..…….8 Шкалирование. Виды шкал………………………………………………………………….….……………………….…...…...9 Анализ заданий теста………………………………………………………………………………………………………....….10 Дискриминативность……………………………………………………………………………………………………….…….11 Стандартизация…………………………………………………………………………………………………………….……..11 Надежность……………………………………………………………………………………….……………………………….13 15.1. Надежность по внутренней согласованности…………………………………….…………………………...….14 15.2. Надежность эквивалентных (параллельных форм)………………………………………………………………14 15.3. Надежность частей теста (деление пополам)……………………………………………………………………..14 15.4. Ретестовая надежность……………………………………………………………………………………………..15 15.5. Источники неудовлетворительной надежности…………………………………………………………………..15 Валидность. Очевидная валидность……………………………………………………………………………………………...16 16.1. Содержательная валидность……………………………………………………………………………………..…16 16.2. Конструктная валидность……………………………………………………………………………...……………17 16.3. Критериальная валидность……………………………………………………………………………...………….17 Адаптация тестов………………………………………………………………………………………………………...……..…18 Психодиагностическая отчетность………………………………………………………………………………………..…..…18 Диагностика интеллекта………………………………………………………………………………………………..………...19 19.1. Диагностика специальных способностей……………………………………………………………….…………20 19.2. Диагностика достижений………………………………………………………………………………...…………22 19.3. Диагностика креативности………………………………………………………………………………..………..22 Тесты личности……………………………………………………………………………………………………….…………..23 20.1. Личностные опросники……………………………………………………………………………….……………23 20.2. Объективные тесты личности……………………………………………………………………….….………….24 20.3. Проективные методики……………………………………………………………………………….…………....26 20.4. Диагностика мотивов, интересов, установок, стереотипов и ценностей…………………………….…………27 Диагностика психологической адаптации личности…………………………………………………………………………..31 Заключение………………………………………………………………………………………………………………………..36 Список литературы……………………………………………………………………………………………………………….37 Темы контрольных заданий……………………………………………………………………………………………………...37 16. 17. 18. 19. 20. 21. 22. 23. 24. 2 1. Введение. В результате усвоения курса психодиагностики студенты должны уметь решать следующие психодиагностические проблемы. 1) Научиться пользоваться стандартными тестами, что предполагает, умение организовать тестирование с соблюдением стандартной процедуры, не вмешиваться в процесс выполнения теста испытуемым (не создавать установок и т.п.), следить за правильным пониманием и выполнением теста. 2) Научиться отличать качественные тесты от некачественных среди большого количества распространяемых в печатном и электронном виде тестов (выяснять валидность, надежность, нормы и другие необходимые параметры тестов). 3) Уметь конструировать собственные тесты и методики, проводить стандартизацию и адаптацию тестов и методик. 2. Предмет психодиагностики. Психодиагностика в сфере прикладной психологии. Психодиагностика – область психологической науки, разрабатывающая методы распознания и измерения индивидуально-психологических особенностей личности. Одной из важнейших задач психодиагностики является создание и совершенствование средств измерения индивидуальнопсихологических черт личности. С помощью психометрии психодиагностика обосновывает требования, предъявляемые к измерению индивидуально-психологических различий, для чего использует достижения математической статистики. Тестология – направление психодиагностики, занимающееся конструированием эффективных тестов, описывающее основные виды тестов и производящее их систематизацию. Тесты – это важнейшее средство фундаментальных исследований. Разработка общих тестов является основной задачей общей психодиагностики. Почти все направления психологических исследований нуждаются в тестировании как средстве сбора данных. Психологические тесты являются стандартными методами изучения столь разных проблем, как индивидуальные различия, возрастные изменения, изучение черт и типов личности, зависимость эффективности деятельности от различных факторов и т.п. В отличие от универсальных методов общей психодиагностики, в прикладной психодиагностике на первый план выходит не логика психологической теории (концепция диагностируемых свойств) и не технологическая логика построения самого психодиагностического метода определенного типа, а логика прикладной области и прикладной задачи. Одной из проблем, побудивших к разработке психологических тестов, было выявление умственно отсталых. И до сегодняшнего дня определение интеллектуальной неполноценности остается важной областью применения определенных видов психологических тестов. Клиническое использование таких тестов включает обследование правонарушителей, лиц с эмоциональными и другими типами отклонений в поведении. Средства психодиагностики – эффективный инструмент при решении проблем в обучении. Школы – один из основных потребителей тестов. Выявление одаренных учащихся, отбор для разных типов обучения. Проверка усвоения учебного материала учащимися. Сферами применения психодиагностических методик и тестов являются: отбор и распределение персонала на всех типах предприятий и организаций; отбор военнослужащих и служащих других специальных служб; психологическое консультирование и психотерапия; изучение влияния реализации социальных программ. Растет использование тестов как средства самопознания и развития личности, вспомогательного средства, облегчающего принятие решения. Чтобы помочь человеку функционировать на максимальном для него уровне, следует начать с выяснения уровня, на котором он уже находится, а для этого необходимо оценить сильные и слабые стороны его личности и выработать соответствующий способ действий. Если тест на чтение показывает, что ребенок отстает в этом виде деятельности, нужно не ограничиваться констатацией этого факта, и не предлагать ему взамен невербальный тест. Становится понятно, что психологический диагноз в этом случае состоит в рекомендации улучшить у этого ребенка навыки чтения. 3 3. История психодиагностики. В конце XIX в. в психологию проникает и быстро завоевывает популярность идея измерения – возможность количественного выражения индивидуальных различий. Это способствует зарождению психодиагностики, оформление которой в качестве самостоятельной области исследований завершается в 20-е гг. ХХ столетия. Значительный вклад в становление психодиагностики внесли труды Ф. Гальтона, Дж. Кэттелла, Г. Эббингауза, Э. Крепелина, А. Бине. Фрэнсис Гальтон в конце ХІХ века положил начало тестированию. Разработал множество простых тестов сенсорного различения, полагал, что они могут служить средством оценки интеллекта человека. Первым применил оценочные шкалы, анкетирование и технику свободных ассоциаций. Начал разрабатывать методы математической статистики. Джеймс Кеттел в 1890 году ввел термин “умственный тест”, но его тесты также измеряли сенсорные, моторные и простые перцептивные процессы. Проверка их результатов показала слабую согласованность тестов между собой, а также несоответствие их внешним критериям – оценке учителями и академической успеваемости учащихся. Э. Крепелин (1895 г.) создал большую серию тестов для измерения практических эффектов памяти, утомляемости, отвлекаемости с помощью элементарных арифметических операций. Г. Эббингауз (1897 г.) предъявлял школьникам тесты арифметического счета, объема памяти и завершения предложений. Тест на завершение предложений был единственным, соответствовавшим учебным достижениям детей. А. Бине (1905 г.) создал первую реальную шкалу интеллекта из 30 заданий возрастающей трудности. Хотя сенсорные и перцептивные тесты тоже были включены, большую часть теста занимал вербальный материал, а именно, способности к суждению, пониманию и рассуждению. В 1908 году тест был усовершенствован. Рассчитан на детей от 3 до 13 лет. Показатель ребенка по тесту выражал умственный уровень, соответствующий возрасту нормальных детей, чье выполнение было таким же. В 1911 году – третий вариант – тест “Бине-Симона”. В Станфордском университете (США) был разработан наиболее удачный вариант переработки этого теста под названием шкалы Станфорд-Бине. В нем впервые был использован коэффициент интеллекта IQ, как отношение между умственным возрастом и фактическим возрастом. Тест интеллекта Бине предполагает индивидуальное исследование. Появление тестов группового тестирования было вызвано потребностями американской армии во время первой мировой войны. Были разработаны тесты группового обследования «армейский альфа» и «армейский бета», где впервые были использованы различные объективные задания с множественным выбором ответов. В 20-х годах стало понятным, что большинство созданных тестов интеллекта, являются тестами способности к обучению. Так появилось понятие тестов способностей. Тесты специальных способностей разрабатывались для использования в профориентации. Развитие психодиагностики с самого начала теснейшим образом связано с появлением и совершенствованием математико-статистического аппарата, и, прежде всего корреляционного анализа и факторного анализа. Появлению факторного анализа обязана разработка комплексных батарей способностей (после 1945 г.). Усовершенствование школьных экзаменов привело к появлению тестов достижений – Р.Л. Торндайк – 1933 г. Одним из первых тестов личности был крепелиновский вариант теста свободных ассоциаций, примененный им для обследования больных с психическими отклонениями (1892). Следует упомянуть также, разработку Ф. Гальтоном, К. Пирсоном и Дж. Кеттеллом стандартизированных анкет и шкал ранжирования, которые в дальнейшем стали использоваться для составления личностных тестов. В качестве исходного варианта личностного опросника можно назвать листок личностных данных Р.С. Вудвортса, разработанный им в годы первой мировой войны для выявления лиц, страдающих неврозами и непригодных к военной службе. Другой подход к измерению личностных характеристик представлен в тестах действия, или ситуационных тестах – конец 20-х – начало 30-х годов ХХ века. Третий подход в изучении личности представляют проективные методики. Тесты свободных ассоциаций и завершения предложений – одни из наиболее ранних проективных методик. В 40-50 гг. в мировой психодиагностике сформировались основные диагностические подходы, была в той или иной степени завершена разработка всех наиболее известных тестов (Шкалы измерения 4 интеллекта Векслера, Тест Роршаха, Тематической Апперцепции Тест, Опросник «Шестнадцать факторов личности», MMPI). В создаваемых в последующие годы за рубежом тестах нет принципиально новых идей и решений. Период временного «затишья» в психодиагностике прекращается в 60-е гг. обращением исследователей к анализу ситуаций, в которых осуществляется поведение (В. Мишель, 1968 и др.). В развитии психодиагностики в СССР можно выделить два периода. Первый следует отнести к началу 20-х – до середины 30-х гг. Это годы массового применения тестов в народном образовании, профотборе и профориентации. Для тогдашнего уровня развития психодиагностики в СССР характерным является широкое заимствование зарубежных тестов. Создавались и собственные методики, но им, как правило, не хватало серьезного теоретического и экспериментального обоснования. В эти годы в области психодиагностики плодотворно работали М.С. Бершнтейн, М.Я. Басов, П.П. Блонский, С.Г. Геллерштейн, Н.Д. Левитов, А.М. Мандрыка, Г.И. Россолимо, М.Ю. Сыркин, И.П. Шпильрейн, А.М. Шуберт и др. Особо следует отметить вклад крупнейшего психолога Л.С. Выготского. Постановлением ЦК ВКП(б) «О педологических извращениях в системе наркомпроссов» (1936) был наложен запрет на применение бессмысленных (как там отмечалось) тестов. Понадобилось около 40 лет, чтобы психодиагностические исследования были восстановлены в своих правах. В конце 60-х гг. начинается второй период развития отечественной психодиагностики, отмеченный бурными дискуссиями о месте ее в системе психологического знания, принципах и методах, об отношении к зарубежному опыту. Постепенно дискуссии уступают место взвешенному научному анализу существующих проблем, поиску их решения. (В.М. Блейхер и Л.Ф. Бурлачук, 1978; Бурлачук, 1979; Е.Т. Соколова, 1980; Психологическая диагностика: Проблемы и исследования, 1981; М.М. Кабанов, А.Е. Личко и В.М. Смирнов, 1983; Б.В. Кулагин, 1984; В.М. Мельников и Л.Т. Ямпольский, 1985; Общая психодиагностика, 1987 и др.) 4. Современные проблемы психодиагностики. 1) Одной из основных проблем психодиагностики, возникшей еще в первой половине ХХ века является постепенно углубляющийся разрыв между практикой и теорией. Заметное отставание теоретического уровня осмысления явлений, на измерение которых направлена психодиагностика, от ее методического оснащения сохраняется и сегодня. 2) Необходимость учета ситуационных факторов, оказывающих не менее значительное влияние на вариативность поведения человека, чем индивидуально-психологические различия, ставит задачу разработки новых инструментов исследования, более надежных и валидных, нежели имеющиеся сегодня. 3) Отсутствие адекватной адаптации зарубежных тестов. 4) Отсутствие норм (стандартизации) для многих тестов. 5) Устаревание многих широко распространенных тестов (устаревание норм, устаревание содержания заданий). 5. Принципы психодиагностики. Этические аспекты. 1) Этические принципы психодиагностического обследования: - Согласие и осознанность решения испытуемого о прохождении тестирования; - Информирование испытуемого о возможном использовании результатов тестирования; - Выполнение тестирования по стандартизированной процедуре для данного теста (бланк, инструкция, обстановка, невмешательство экспериментатора); - Анонимность групповых обследований и сохранение в тайне результатов индивидуального тестирования; - Обязательство хранить профессиональную тайну теряет силу, если положение закона обязывает психолога сообщить о полученной информации; - Ограничение доступа к тестовым данным; - При сообщении результатов тестирования необходимо учитывать особенности того человека, которому они предназначаются; 5 - Индивиду не должны сообщаться результаты его обследования без их интерпретации специалистом. Использовать психодиагностические тесты могут лица трех категорий: Психолог-психометрист, занимающийся разработкой и адаптацией психодиагностических методик; - Психолог-пользователь, использующий в своей работе психодиагностические методики; - Специалист-непсихолог, работающий в смежных областях (учитель, врач, социолог, экономист и др.) и применяющий в своей работе отдельные психодиагностические методики. 2) Общие методические принципы психодиагностики: - Использование норм. (См. п. 14). - Проверка надежности. (См. п. 15). - Проверка валидности. (См. п. 16). - Проверка дискриминативности. (См. п. 13). - Анализ и отсеивание заданий. (См. п. 12). 6. Классификация тестов. Психологический тест – стандартизированное, часто ограниченное во времени испытание, предназначенное для установления количественных (и качественных) индивидуально-психологических особенностей через вербальные или невербальные образцы ответов или другие виды поведения. Психологический тест может быть охарактеризован как эффективный при условии, что он отвечает определенным требованиям: 1. Использование шкалы интервалов; 2. Надежность; 3. Валидность; 4. Дискриминативность; 5. Стандартизованность предъявления и обработки результатов. 6. Независимость результатов от влияния экспериментальной ситуации и личности психолога. 7. Наличие нормативных данных, а в случае индивидуально–ориентированных тестов – наличие критериев, установленных экспертами. Тесты делятся на индивидуальные и групповые (по процедуре проведения). По конструкции – на гомогенные и гетерогенные. По психодиагностическому методу – на объективные (диагностика осуществляется на основе успешности/результативности и способа/особенностей выполнения деятельности); субъективные (на основе самоописания особенностей личности, поведения в тех или иных ситуациях) и проективные (на основе взаимодействия с внешне нейтральным материалом, становящимся в силу его неопределенности объектом проекции). По изучаемым переменным – на две большие группы – интеллекта и личности. 6 Тесты Интеллекта (общих способностей) Интеллекта Способностей Достижений (специальных способностей) Креативности Личности (объективные) Объектив ные тесты действия На основе решения объективн ых перцептив ных, когнитивн ых и эстетичес ких задач Личностны е переменны е и некоторые особенност и когнитивн ых процессов – когнитивн ый стиль и др. Замаскиро ванных фигур тест Ситуацио нные тесты На основе помещени я обследуем ого в ситуации, близкие к реальным. Личностн ые переменн ые, особенно сти реагирова ния на различны е типы ситуаций Личности Проективные Личностные опросники Тесты построены на основе решения объективных вербальных, арифметических, логических, практических и др. задач На основе изучения качества и количества найденных решений задач, выдвигаемых идей Основаны на механизме проецирования личностных свойств на субъекта неопределенн ые стимулы Личностные переменные, установки, особенности психологическ их защит, бессознательн ого Основаны на самоописании испытуемым своей личности и поведения Особенности познавательны х процессов: мышление, память, воображение СтанфордБине, Векслер Амтхауэр ШТУР Отдельные аспекты интеллекта и психомоторные функции, использующиеся в конкретных, узких областях деятельности: а) сенсорные, моторные, технические; б) профессионализир ованные (счетные, музыкальные, скорости чтения) Тестовые батареи специальных способностей Оценка достигнутого уровня развития навыков, знаний, умений. Творческие способности: продуцировать новые идеи, находить нетрадиционные способы решения проблемных задач Различные особенности личности и межличностных отношений: а) опросники черт личности; б) опросники типологические; в) опросники мотивов; г) опросники интересов; д) опросники ценностей; е) опросники установок; ж) опросники состояний «16 Личностных Факторов», Лири интерперсональный диагноз, Уровень тревоги Тейлор и др. Тестовые батареи общих достижений, экзаменационны е тесты Методика «креативного поля» Д.Б. Богоявленской Тест на стресс «Констру ктор» ТАТ, тест Роршаха, тест Розенцвейга, тест Люшера 7. Этапы создания теста. Для конструирования эффективного теста необходимо выполнить следующие шаги: 1) Рассмотреть и установить строгие ограничения на содержание заданий в соответствие с теоретической концепцией исследуемого психологического свойства. 2) Сформулировать так много разнообразных заданий, релевантных этому содержанию, насколько это возможно. 3) Испытать эти задания на такой большой выборке испытуемых, насколько возможно. 4) Выполнить анализ заданий теста, отбирая эффективные. (Анализ заданий – процедура для оценки эффективности заданий в тесте; она может включать определение корреляции заданий с общим показателем по тесту, факторный анализ заданий и др. способы.) 5) Кросс-валидизировать задания на новой выборке. Проверьте, чтобы задания адекватно охватывали соответствующий контекст. 6) Вычислить показатель надежности теста. 7) Валидизировать тест. 8) Определить нормы для этого теста. 9) Выполнить факторный анализ заданий и сравнить его с процедурой анализа и отбора заданий. 10) Если тест представляется эффективным и полезным, представить результаты в руководстве по тесту. 8. Исходная гипотеза. Теоретический конструкт. Разработка любого теста или психодиагностической методики начинается с формулирования теоретического конструкта по той психологической переменной, которую предстоит изучить. Этот теоретический конструкт должен включать описание переменной, описание предполагаемых ее взаимосвязей с другими свойствами личности и гипотезу о том, в каких заданиях (вербальных или невербальных) эта переменная может проявить себя. В качестве источников для создания теоретического конструкта можно использовать литературу по изучаемой проблеме, словари, мнения 7 экспертов. Далее необходимо на базе уже существующих тестовых моделей (тесты интеллекта, личности, проективные методики и т.д.), либо собственной новой модели, выбрать форму теста, релевантную задаче диагностики необходимой переменной. Первый способ конструирования теста состоит в разработке тестовых заданий в соответствии с выбранной моделью теста на основе сформулированной теоретической гипотезы (теоретического конструкта). Основные типы заданий теста В зависимости от структуры заданий и способа ответа задания могут быть: - задания с предписанными ответами (закрытые); - задания со свободными ответами (открытые). Задания с предписанными ответами в свою очередь делятся на: задачи с альтернативными ответами; задачи с множественным выбором; задачи с выражением ответа в виде восстановления частей предложений, фигур и т.д.; задачи с переструктурированием данных, требующие перегруппировки элементов. Задания со свободными ответами включают: задачи дополнения символа, рисунка, высказывания и т.п.; задачи свободного конструирования ответа, которые в свою очередь делятся на задания с малоструктурированным стимулом (проективные) и задачи конструирования по четко заданной схеме. Общие правила разработки заданий теста 1) Легкость понимания: - В основе каждой задачи, вопроса, набора суждений и т.п. должна лежать одна мысль. Если состав утверждений сложный, то формулировку следует сократить или разделить на необходимое количество пунктов. - Следует избегать употребления многозначных понятий, редких значений слов, сленга, диалектизмов, узкоспециальных терминов и формулировок. - Следует помнить, что слишком короткие, в телеграфном стиле, формулировки вызывают дополнительные вопросы и нередко являются многозначными. 2) Относительная новизна для испытуемых по способу решения и содержанию. 3) Лаконичность: - Необходимо избегать непомерно длинных высказываний, использование которых ведет к затруднению понимания, удлиняет время обследования, излишне утомляет, создает условия для возникновения посторонних помех, которые могу повлиять на результаты тестирования (устойчивость внимания, навык чтения, индивидуальный уровень понимания сложных предложений и т.п.). 4) Минимальная вероятность случайного решения: - Избегать заданий с альтернативными вариантами ответов, где вероятность угадывания составляет 50%. - Задачи не должны быть похожими друг на друга по содержанию, чтобы решение одной задачи не случило „ключом” для другой. 5) Экономичность с точки зрения времени выполнения. - В тесте не должно быть заданий на сложные арифметические вычисления или требующих длительного обдумывания. 6) Экономичность с точки зрения обработки. - Задания должны быть компактны и удобны для учета результатов и обработки материала экспериментатором, допускали возможность формализации окончательных результатов, четкой стандартизации процедуры и интерпретации. 7) Адекватность: - Задачи должны быть реальными, отражать существующие отношения, соответствовать времени, иметь конкретное содержание. По мере подготовки набора заданий производится проверка объективности и корректности их формулировок – методом экспертного опроса (аналогично проверке валидности содержательной). 8 Отобранные задания размещаются по степени трудности (тесты интеллекта, способностей, достижений), либо в случайном порядке (гомогенные тесты). Задания также могут объединяться в блоки для измерения определенного фактора (гетерогенные тесты, например, тест «Тревога и тревожность» Спилбергера и Ханиной состоит из двух блоков для измерения тревоги ситуативной и личностной). Второй способ – критериально-ключевой принцип – это принцип конструирования тестов на основе обнаружения (эмпирического) психологических признаков, позволяющих дифференцировать релевантные критериальные группы от контрольных. Примером методик, созданных по этому принципу, является Миннесотский многоаспектный личностный опросник (MMPI), “Бланк интересов” Стронга, первый – в клинической психологии, второй – в области профориентации. Так, при разработке MMPI из первоначального банка утверждений в основные клинические шкалы включались только те, которые хорошо диагностировали испытуемых с тем или иным клиническим диагнозом от контрольной группы здоровых людей. В качестве критерия, соответственно, здесь использовался психиатрический диагноз испытуемых, определенный традиционным способом. В шкалы “Бланка интересов” Стронга вошли те утверждения из первоначального набора, которые реально разделяли группы лиц, являвшихся носителями определенных интересов. Третий способ – факторно-аналитический принцип – это принцип конструирования тестов на основе выявления ограниченного, определяемого разработчиком круга факторов. Под фактором разумеется конструкт, операционально определяемый его факторными нагрузками. Под факторными нагрузками понимаются значения корреляции переменных с данным фактором. При разработке теста корреляционному анализу подвергаются связи между заданиями, и в тесте оставляются только те из них, которые коррелируют с общим фактором. Данная процедура обеспечивает уверенность в том, что тест измеряет только одну переменную и каждое задание измеряет эту же переменную. Тест может измерять переменные, связанные с несколькими факторами, в том случае, если по своей сути он представляет набор субтестов, каждый из которых направлен на один из факторов-конструктов. Примером тестов, созданных в соответствии с факторно-аналитическим принципом, могут служить “Шестнадцать личностных факторов” опросник, Айзенка личностные опросники. Не нужно противопоставлять критериально-ключевой принцип конструирования тестов факторно-аналитическому. Разработанный по критериально-ключевому принципу тест в последующем может пройти процедуру факторизации. 9. Истинный показатель. Репрезентативность заданий теста. Репрезентативность – свойство выборочной совокупности представлять характеристики генеральной совокупности. Это означает, что с определенной погрешностью можно считать, что представленное в выборочной совокупности распределение изучаемых признаков психологической переменной соответствует их реальному распределению. Для любой черты (например, интеллекта, экстраверсии, тревожности) индивидуум имеет истинный показатель. Его можно было бы вычислить, если бы было возможно предъявить испытуемому все возможные задания по диагностике данной черты. Любой показатель по тесту для некоторого индивидуума в каждом отдельном случае отличается от его истинного показателя на величину случайной погрешности, появляющейся в результате выполнения испытуемым не всех возможных заданий, а только выборочных. Тест будет работать ошибочно, когда выборка его заданий не отражают удовлетворительно генеральную совокупность заданий – в этом состоит репрезентативность заданий теста. 10. Репрезентативность выборки испытуемых. Репрезентативность – свойство выборочной совокупности представлять характеристики генеральной совокупности. Выборка испытуемых должна адекватно отражать генеральную совокупность людей, для которой будет применяться данный тест. Если тест будет применяться для школьников, то в выборке должны быть в соответствующей пропорции представлены школьники частных и государственных школ, школ математического и гуманитарного профилей, сельских и городских школ и т.п. Требование репрезентативности выборки испытуемых в психодиагностике важно при определении норм теста и проведении стандартизации, при формировании выборок критериальных и 9 контрольных групп при конструировании теста по критериально-ключевому принципу, при апробации теста, проверке надежности и валидности теста и других психометрических процедурах. 11. Шкалирование. Виды шкал. Шкала – форма фиксации совокупности признаков изучаемого объекта с упорядочением их в определенную числовую систему. Пример – Цельсий для шкалирования температуры взял две точки отсчета – точку замерзания воды и точку кипения воды. Разделил этот интервал на 100 равных отрезков и таким образом, ввел температурную шкалу, которой мы пользуемся, говоря, что на улице -5 градусов мороза или 25 градусов тепла. Фаренгейт создал другую шкалу, градус по шкале Фаренгейта не равен градусу Цельсия. Существуют шкалы нескольких уровней, иерархически упорядоченных по сложности. Это следующие уровни, начиная с простейшего: 1) Номинативные шкалы (шкалы наименований) – простейшая классификация, устанавливающая соответствие признака тому или иному классу. Простейший случай номинативной шкалы – дихотомическая шкала, состоящая всего лишь из двух ячеек: «имеет братьев и сестер – единственный ребенок в семье»; «иностранец соотечественник»; «проголосовал «за» – проголосовал «против»» и т.п. Признак, который измеряется по дихотомической шкале наименований, может принимать всего два значения. Тогда можно говорить о том, что тот или иной признак «проявился» или «не проявился». Например «Признак леворукости проявился у 8 испытуемых из 20». Более сложный вариант номинативной шкалы – классификация из трех и более ячеек: «экстрапунитивные – интрапунитивные – импунитивные реакции»; «выбор кандидатуры А – кандидатуры Б – кандидатуры В – кандидатуры Г» и т.п. Допустим, что кандидатуру А выбрали 7 испытуемых, кандидатуру Б – 11, кандидатуру В – 28, а кандидатуру Г – всего 1.Теперь можно оперировать этими числами, представляющими собой частоты встречаемости разных наименований, то есть частоты принятия знаком «выбор» каждого из 4 возможных значений. 2) Порядковые (ранговые) шкалы – элементы шкалы упорядочены (ранжированы) по принципу «больше - меньше», но в этой шкале не учитываются расстояния между ними. В шкале наименований не имеет значения, в каком порядке расположены классификационные ячейки, а в шкале порядков они образуют последовательность от ячейки «самое малое значение» к ячейке «самое большое» (или наоборот). В порядковой шкале должно быть не менее трех рангов: Семантический дифференциал (7 рангов: -3, -2, -1, 0, 1, 2, 3) или опросник со следующими вариантами: Бывает, что я никак не могу принять какое-то окончательное решение...а) Полностью согласен. б) Могу согласиться. в) Не уверен. г) Скорее не согласен. д) Совершенно не согласен. 3) Шкалы интервалов. Они классифицируют по принципу «больше на определенное количество единиц – меньше на определенное количество единиц». В них разности между значениями во всех точках данной шкалы равны. Равноинтервальными можно считать лишь шкалы в единицах стандартного отклонения и процентильные шкалы, и то лишь при условии, что распределение значений в выборке стандартизации было нормальным. Принцип построения большинства интервальных шкал построен на правиле «трех сигм»: примерно 97,7-97,8% всех значений признака при нормальном его распределении укладываются в диапазоне М±3σ, где М – среднее арифметическое, σ - среднее квадратическое отклонение. Можно построить шкалу в единицах долей стандартного отклонения, которая будет охватывать весь возможный диапазон изменения признака, если крайний слева и крайний справа интервалы оставить открытыми. Эквивалентные интервальные шкалы могут быть линейно преобразованы друг в друга, что позволяет приводить результаты тестирования к общим шкалам и таким образом осуществлять сравнение показателей. Более того, многие статистические процедуры предполагают измерения по шкале интервалов. К разряду шкалы интервалов относятся шкалы IQ-показателя стандартного, Т-баллов, стенов и др. 10 Шкалы отношений (равных отношений). Шкалы отношений помимо всего имеют значимую нулевую точку (в отличие от интервальной шкалы она не произвольна, а указывает на полное отсутствие измеряемого свойства). Наличие такой точки – проблема для большинства психологических переменных, хотя существуют методы конструирования тестов, позволяющие использовать эту возможность. Возможности человеческой психики столь велики, что трудно представить абсолютный нуль в какой либо измеряемой психологической переменной (абсолютная глупость или абсолютная честность – понятия скорее житейской психологии). Считается, что примерами шкал равных отношений в психологии являются шкалы порогов абсолютной чувствительности анализаторов. В идеале разработчик тестов должен стремиться использовать шкалы отношений. Если это невозможно, желательны шкалы интервалов. 12. Анализ заданий теста. В заданиях может анализироваться как их качественная сторона, т.е. их содержание и форма, так и количественная, т.е. их статистические свойства. Количественный анализ означает главным образом измерение трудности и валидности заданий. Валидность и надежность теста, в конечном счете, зависят от свойств заданий, и их предварительный анализ позволяет повысить эти свойства теста. Устраняя, добавляя, заменяя или пересматривая отдельные задания, можно усовершенствовать тест в целом. Анализ заданий позволяет сократить тест, повышая в то же время его валидность и надежность. Трудность заданий Трудность заданий определяется процентом испытуемых, давших правильный ответ. Обычно задания располагаются в порядке нарастания трудности. Такое расположение дает индивиду больше уверенности и снижает вероятность того, что он, затратив слишком много времени на задания, которые для него слишком трудны, упустит из вида те, которые ему по силам. Большинство стандартизированных тестов способностей предназначены для как можно более точной оценки индивидуального уровня развития способности, и если в таком тесте никто не может справиться с задание, оно оказывается просто лишним грузом. То же можно сказать и о заданиях, с которыми справляются все. Чем ближе трудность задания к 1,00 или к 0, тем менее дифференцированную информацию можно получить с его помощью. И наоборот, чем ближе уровень трудности к 0,50, тем выше его разрешающая способность. Это значит, что из 100 испытуемых 50 справились и 50 не справились с заданием (р=0,50). Задания лучше всего выбирать так, чтобы уровень трудности отдельных заданий имел некоторый умеренный разброс, но в среднем составлял 0,50. Однако, есть исключения из этого правила. Для примера рассмотрим программу оценки прогресса в образовании в США. В программе никак не отражались индивидуальные достижения, ее целью было описать знания, понимание и навыки, свойственные американцам. Нужно было получить ответы на следующие три вопроса: (1) Что знают почти все американцы? (2) Что знает средний американец? (3) Что знают наиболее способные американцы? Чтобы ответить на эти вопросы, были подготовлены задания трех уровней трудности: одну треть составляли легкие задания (р=0,9), другую треть – упражнения средней трудности (р=0,5) и последнюю треть – трудные упражнения (р=0,1). Другой пример, иллюстрирующий выбор трудности заданий сообразно назначению теста, связан с тестированием владения навыком (тесты достижений). Если назначение теста – установить, овладел ли индивид существенными элементами того или иного навыка или усвоил ли он знания, необходимые для перехода к следующему этапу обучения, то трудность задания должна быть на уровне 0,8-0,9 (легкие, на усвоенные знания или навыки). Аналогично тест, проводимый перед началом обучения, может включать только задания с очень низким и даже нулевым р (очень трудные), поскольку они выявляют то, что еще осталось неусвоенным. Из приведенных примеров явствует, что уровень трудности заданий зависит от назначения теста. Хотя в большинстве случаев, максимум информации об индивидуальном уровне выполнения теста обеспечивают задания средней трудности. Валидность заданий 4) 11 Валидность по критерию – соотношение между выполнением задания и контрольным критерием. Должна быть значимая корреляция с критерием и низкая корреляция с безотносительными к тесту факторами. Метод экстремальных (контрастных) групп. Сравнение выполнения испытуемыми заданий теста с контрастными группами по критерию. Например, в классе можно выделить две группы – с низкой успеваемостью и с высокой. В результатах теста должна наблюдаться та же ситуация. Валидность по внутренней согласованности – аналогично надежности по внутренней согласованности – корреляция отдельных заданий теста с общим показателем теста. Перекрестная валидизация. Важно, чтобы валидность теста проверялась на выборке испытуемых, отличной от той, с помощью которой производился отбор заданий. Любой коэффициент валидности, найденный по выборке, применявшийся для отбора заданий, окажется завышенным, так как случайные особенности этой выборки будут учитываться как истинные свойства популяции. 13. Дискриминативность теста. Дискриминативность – способность отдельных заданий теста и теста в целом дифференцировать обследуемых относительно «максимального» и «минимального» результата теста. Какова ценность психологического теста, по которому все испытуемые показали одинаковые результаты. Пример недискриминативного задания: «Любите ли Вы хорошую музыку?». Практически все испытуемые ответят «да». На вопрос «Пользуетесь ли Вы чужой зубной щеткой?» все ответят «нет». Основной показатель коэффициента дискриминативности σ Фергюсона прост в вычислении. Коэффициент σ Фергюсона – это отношение между показателем дискриминативности, полученным для некоторого теста, и максимальным значением дискриминативности, которое может обеспечить такой тест. nN 2 Где N – количество испытуемых, n – количество заданий, fі – частота встречаемости каждого показателя. σ =0, когда все испытуемые получили одинаковые показатели (то есть когда нет дискриминативности), и равно 1 при равномерном (прямоугольном) распределении. 14. Стандартизация теста. Стандартизация теста – унификация, регламентация, приведение к единым нормам процедуры и оценок теста. В психодиагностике нужно различать две формы стандартизации. В первом случае под стандартизацией понимаются обработка и регламентация процедуры проведения, унификация инструкции, бланков обследования, способов регистрации результатов, условий тестирования, характеристика контингентов испытуемых. Во-втором - процедура получения показателей по тесту (норм) для репрезентативных групп испытуемых, чем достигается сопоставимость получаемых результатов у разных испытуемых. Нормы – это множество показателей из четко определенных выборок, а разработка и процедуры получения этих показателей составляют процесс стандартизации теста. Стандартизация теста производится на очень больших группах испытуемых. Для получения нормы для общей популяции, например, детей школьного возраста, необходима выборка около 10000 испытуемых. Однако выборка из ограниченной популяции (мастеров парашютного спорта или участников боевых действий ВОВ), конечно, не должна быть столь большой. Репрезентативность выборки является более важной, чем ее размер. Небольшая, но репрезентативная выборка будет предпочтительнее, чем большая, но неравномерно представленная. Благодаря стандартизации мы можем сравнить результаты отдельного испытуемого с результатами «большинства подобных людей», то есть релевантной группы (релевантная группа – это группа, которая соответствует данному индивидууму по значимым для данного исследования показателям – возрасту, полу, национальности, социальному статусу, образованию и т п.), и σ= ( n + 1)( N 2 − ∑ f i ) 2 12 проинтерпретировать его результаты в терминах большей или меньшей выраженности у него тех или иных индивидуально-психологических особенностей по сравнению с другими людьми. Обычно показатели некоторого индивидуума сравниваются с показателями релевантной нормативной группы посредством некоторого преобразования, которое выявляет статус этого индивидуума относительно данной группы. Сравнение показателя индивидуума и нормативной группы в «сырых» баллах подходит для исследовательских целей, но неудобно в прикладной психологии. Например, в ситуации психологического консультирования, говорить, что клиент имеет показатель 95, а среднее по выборке – 38,6 баллов по данному тесту, или таким же образом обсуждать результаты кандидатов на вакансию при профотборе, достаточно трудоемкий анализ, который, к тому же, порождает путаницу в цифрах. Преобразование «сырых» баллов, упрощающее их анализ и интерпретацию, называется нормализацией показателей, и осуществляется методами процентилей и стандартизованных показателей: Z-показателей, Т-баллов, стенов, стенайнов, IQ-показателя стандартного. Процентили Ранг показателя в процентилях определяется процентным отношением в группе стандартизации (нормативной группе) тех испытуемых, которые получили более низкий показатель. Значение 20 процентилей у испытуемого по какому-либо тесту означает, что 20% из популяции имеют показатели ниже данного. Недостатками процентилей является то, что они не могут быть использованы для последующего статистического анализа, потому, что они являются значениями порядковой шкалы. Кроме этого они могут исказить результаты, т.к. распределение процентилей равномерное (прямоугольное), а распределение для многих тестов приближается к нормальному. Z-показатели Стандартизованный показатель – это отклонение необработанного («сырого») показателя от среднего значения, деленное на стандартное отклонение распределения: Ζ= x−x Где Z – стандартизованный показатель, x – «сырой» показатель, ⎯х – среднее, σ – среднее квадратическое (стандартное) отклонение. Если распределение сырых показателей нормальное, то Z – показатели будут изменяться от –3 до +3. Так, если у нас есть множество «сырых» показателей с ⎯х=50 и σ=10, то могут быть сделаны преобразования «сырых» в стандартизованные показатели, как показано в Таб. 14.1. «Сырые» показатели 60 65 50 40 54 Вычисление (60 – 50) / 10 = (65 – 50) / 10 = (50 – 50) / 10 = (40 – 50) / 10 = (54 – 50) / 10 = Z 1,0 1,5 0 -1,0 0,4 σ Таб. 14.1 Вычисление Z – показателей Недостатками Z – показателей является то, что их среднее значение = 0, а наивысшее возможное значение = 3; наличие отрицательных и дробных значений; слишком малое количество целых позиций шкалы. Это привело к тому, что разработчики тестов стали применять дальнейшие преобразования Z – показателей. Стандартизованный преобразованный Z – показатель - Zt Стандартизованное преобразование Z – показателей состоит в следующем: Zt = А+ВZ, где Zt – преобразованный Z – показатель, А – среднее значение преобразованного распределения, В – стандартное отклонение преобразованного распределения и Z – Z – показатель. Так, если «сырой» показатель ⎯х=50, σ=10, а для преобразованного распределения ⎯х=100, σ=10, получаем следующие результаты Zt : «Сырые» показатели Вычисление Z Вычисление Zt 13 60 65 50 40 54 (60 – 50) / 10 = (65 – 50) / 10 = (50 – 50) / 10 = (40 – 50) / 10 = (54 – 50) / 10 = 1.0 1.5 0 -1.0 0.4 Zt = 100 + 1 ∗ 10 = Zt = 100 + 1,5 ∗ 10 = Zt = 100 + 0 ∗ 10 = Zt = 100 - 1∗10 = Zt = 100 + 0,4 ∗ 10 = 110 115 100 90 104 Таб. 14.2 Вычисление преобразованных Z – показателей При конструировании тестов обычно производится преобразование Z – показателей к распределению со средним значением ⎯х=50 и стандартным отклонением σ=10. В этом случае если распределение приближается к нормальному, показатели будут изменяться от 80 до 20. Показатели шкалы такого масштаба называют Т-показателями (используются в MMPI и др. тестах). Другим широкоупотребимым масштабом шкалы являются ⎯х=100, σ=16 - это шкала IQ-показателя стандартного, используемого в тестах интеллекта. Следующие преобразования, широко применяемые в прикладной психологии, являются показатели в стенайнах и стенах. Стенайн (от англ. standard и nine) – стандартизованный показатель, который разбивает нормальное распределение на девять интервалов–категорий. Наивысшая категория, 1, и наинизшая, 9, обе содержат по 4% распределения; категории 2 и 8 содержат по 7% каждая; категории 3 и 7 – по12% каждая; категории 4 и 6 – по 17% каждая и категория 5 содержит 20%. Аналогичная форма – нормализованный показатель в стенах (от англ. standard и ten) – делит нормальное распределение на десять категорий (тест “16PF” Р. Кэттелла). 15. Надежность теста. Надежность – характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов; согласованность теста внутренняя и по прошествии времени. В самом широком смысле надежность теста показывает, в какой степени индивидуальные различия в тестовых результатах оказываются «истинными», а в какой могут быть приписаны случайным ошибкам. Требования к выборке испытуемых для исследования надежности: репрезентативность выборки, объем - не менее 200 человек. Существует несколько способов измерения надежности методики. Основной статистический метод проверки надежности – корреляционный анализ. Корреляционная связь – это согласованные изменения двух признаков или большего количества признаков (множественная корреляционная связь). Корреляционная связь отражает тот факт, что изменчивость одного признака находится в некотором соответствии с изменчивостью другого. Корреляционному анализу подлежат как количественные, так и качественные признаки. К количественным относятся переменные, измеряемые в интервальной шкале и шкале отношений (для вычисления корреляции чаще всего применяется коэффициент линейной корреляции r Пирсона.) К качественным относятся переменные, не имеющие единиц измерения, оцениваемые шкалами наименований и порядковыми шкалами (корреляция качественных признаков, коэффициент корреляции рангов Спирмена rs). Может быть также установлена корреляция и для признаков, один из которых является качественным, а другие количественными – корреляция бисериальная. Достоверность полученного коэффициента корреляции определяется с помощью статистических критериев и уровня статистической значимости. В психологии принято считать низшим уровнем статистической значимости 10% уровень (ρ≤0,10), достаточным – 5% уровень (ρ≤0,05) и высшим 1% уровень (ρ≤0,01) (Сидоренко Е.В., 1996). Когда указывается, что различия достоверны на 5% уровне значимости, то имеется в виду, что вероятность того, что они все-таки недостоверны, составляет 0,05. Коэффициент корреляции может принимать значения от –1 до +1 и показывает силу связи и ее направление – прямая или обратная. Используется две системы классификации корреляционных связей по их силе: общая и частная. Общая классификация корреляционных связей: при коэффициенте корреляции r>0,70; 1) сильная 2) средняя при 0,50