Психодиагностический метод отличается определенной спецификой по отношению к традиционным исследовательским методам психологии — неэкспериментальному (описательному) и экспериментальному.
Важнейшее из этих требований — СТАНДАРТИЗАЦИЯ инструмента измерения, в основе которой лежит понятие нормы, поскольку индивидуальная оценка (например, успешность выполнения того или иного вида задания) может быть получена путем сопоставления с результатами других обследуемых. Благодаря стандартизации методики достигается сопоставимость полученных результатов у разных испытуемых, появляется возможность сопоставления таких оценок в разных тестовых методиках. В психологической диагностике различают две формы стандартизации:
1) обработку и регламентацию процедуры проведения, унификацию инструкции, бланков обследования, способов регистрации результатов, условий проведения обследования, характеристику контингентов испытуемых;
2) преобразование нормальной (или искусственно нормализованной) шкалы оценок в новую шкалу, основанную уже не на количественных эмпирических значениях изучаемого показателя, а на его относительном месте в распределении результатов в выборке испытуемых. Наиболее распространенными преобразованиями первичных оценок в психометрике являются центрирование и нормирование посредством среднеквадратичных отклонений. Под центрированием понимается линейная трансформация величин признака, при которой средняя величина распределения становится равной нулю.
В качестве функции нормирования обычно выступает Z-показатель (стандартный показатель), выражающий отклонение индивидуального результата в единицах, пропорциональных стандартному отклонению единичного нормального распределения.
Благодаря возможности подобных преобразований шкалы, традиционно принятые в психодиагностике и построенные на основе шкалы Z-показателя, становятся сопоставимыми, и возможен переход из одной шкалы в другую с иными показателями.
Наиболее существенны также требования, предъявляемые к НАДЕЖНОСТИ и ВАЛИДНОСТИ инструмента измерения, и жесткая регламентация процедуры обследования, заключающаяся в точном соблюдении инструкции, строго определенных способах предъявления стимульного материала, невмешательстве исследователя в деятельность испытуемого и т. п.
НАДЕЖНОСТЬ — неотъемлемая характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов.
Результат психологического исследования обычно подвержен влиянию большого количества неучитываемых факторов (таких как эмоциональное состояние и утомление, если они не входят в круг исследуемых характеристик, освещенность, температура и другие особенности помещения, в котором проводится исследование, уровень мотивированности испытуемых на исследование и др.) Любое изменение ситуации исследования усиливает влияние одних и ослабляет воздействие других факторов на результат теста.
Общий разброс (дисперсию) результатов тестового обследования можно, таким образом, представить как результат влияния 2 групп причин: изменчивости, присущей самому измеряемому свойству, и факторов нестабильности измерительной процедуры.
В широком смысле под надежностью понимается характеристика того, в какой степени выявленные у испытуемых различия по тестовым результатам являются отражением действительных различий в измеряемых свойствах и в какой мере они могут быть приписаны случайным ошибкам.
В более узком смысле применительно к методам определения характеристик надежности под этой группой показателей подразумевается степень согласованности результатов теста, получаемых при первичном и повторном его применении, по отношению к тем же испытуемым в различные моменты времени, с использованием разных (но сопоставимых по характеру) наборов тестовых заданий или при иных изменениях условий обследования.
Распределение оценок испытуемых при выполнении теста, измеряющего одно качество, в идеальном случае совпадает с так называемым нормальным распределением, и дисперсия при этом будет истинной ( т. е. отражающей вариативность только измеряемого признака). Каждый испытуемый занимает определенное место по оценкам теста, и теоретически это место для каждого члена выборки постоянно. В рассматриваемом случае повторноевыполнение теста теми же лицами должно давать распределение мест на шкале оценок, идентичное первому. Тогда методика как измерительный инструмент точна и максимально надежна. Реальные оценки и ранговые места испытуемых при повторном обследовании изменяются, и их распределение в той или иной степени отличается от исходного. При этом дисперсия нового распределения выше исходного на величину дисперсии ошибок измерения.
В зависимости от условий, влияющих на результаты теста, выделяют следующие типы характеристик надежности.
1. РЕТЕСТОВАЯ НАДЕЖНОСТЬ определяется путем повторного обследования испытуемых с помощью одного и того же теста. Этот показатель вычисляется по соответствию результатов первого и второго обследований или по сохранению ранговых мест испытуемых в выборке при ретесте. Коэффициент надежности соответствует коэффициенту корреляции между полученными результатами.
2. НАДЕЖНОСТЬ ПАРАЛЛЕЛЬНЫХ ФОРМ определяется с помощью взаимозаменяемых форм теста. При этом одни и те же испытуемые обследуются вначале с использованием основного набора заданий, а затем — с применением аналогичных дополнительных. Коэффициент надежности может быть определен и другим способом: испытуемые делятся на примерно равные группы, затем одной из них предлагается форма А теста, а другой — форма Б. Через определенное время (обычно не более недели) проводится повторное тестирование, но в обратном порядке. Такая процедура обследования лишена значительной части недостатков способа ретестовой надежности. Так как в параллельной форме используется другой по содержанию материал, возможность тренировки и запоминания отдельных решений уменьшается. Важнейшим преимуществом данного метода является сокращение временного интервала перед повторным обследованием. Коэффициент корреляции между результатами первичного и повторного тестирования, оценивающий как временную стабильность теста (собственно надежность), так и степень соответствия результатов обеих форм теста, является основным показателем данной характеристики надежности. Если формы применяются непосредственно одна за другой, то корреляция отражает их взаимозаменяемость.
3. НАДЕЖНОСТЬ ЧАСТЕЙ ТЕСТА — третья характеристика надежности психодиагностических методик. Этот показатель выявляют путем анализа устойчивости результатов отдельных совокупностей тестовых задач или единичных пунктов (заданий) теста.
Наиболее распространенным видом надежности частей теста является метод расщепления, суть которого сводится к выполнению испытуемым заданий из 2 равноценных частей теста.
Обоснованием метода служит вывод о том, что при нормальном или близком к нормальному распределению оценок по полному тесту выполнение любого случайного набора из частей теста даст аналогичное распределение (при условии, что части однородны по характеру заданий, отношению к тесту в целом).
Для оценки надежности этим методом выбираются 2 эквивалентные по характеру и степени трудности группы задач. Разделение объема заданий теста на сопоставимые части достигается распределением заданий на четные и нечетные (в том случае, если задания четко ранжированы по степени субъективной трудности); разделением пунктов по принципу близости или равенства значений индексов трудности и дискриминативности (такой принцип разделения пригоден для тестов достижений, в которых обязателен ответ испытуемых на все пункты); разделением задач по времени решения каждой из частей (для тестов скорости).
Для испытуемых в выборке вычисляются оценки успешности решений (раздельно для каждой из частей теста), среднеквадратичные отклонения первого и второго рядов оценок и коэффициенты корреляции сравниваемых рядов. Естественно, эти коэффициенты будут характеризовать надежность лишь половины теста.
Характеристика надежности по этому типу имеет ряд преимуществ по сравнению с рассмотренными выше ретестовой и надежностью параллельных форм благодаря отсутствию необходимости в повторном обследовании (снимается влияние многих посторонних факторов, например тренировки, запоминания решений и т. п.). В то же время невозможность установить устойчивость результатов теста спустя определенное время требует ком-бинирования этого метода с другими типами характеристики надежности психодиагностической методики.
ВАЛИДНОСТЬ — комплексная характеристика теста, включающая сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним.
В наиболее простой и общей формулировке ва-лидность — это понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает.
В стандартных требованиях к педагогическим и психологическим тестам валидность определяется как комплекс сведений о том, относительно каких групп психологических свойств личности могут быть сделаны выводы, а также о степени их обоснованности на основании конкретных тестовых оценок или других форм оценивания.
В психологической диагностике валидность — наиболее важная часть информации о методике, включающая данные о степени согласованности результатов теста с другими сведениями об исследуемой личности, полученными из различных источников (теоретических ожиданий, наблюдения, экспертных оценок, по результатам других методик, достоверность которых установлена, и т. д.), суждение об обоснованности прогноза развития исследуемого качества, связи изучаемой области поведения или особенности личности с определенными психологическими конструктами. Валидность описывает также конкретную направленность методики (контингент испытуемых по возрасту, уровню образования, социально-культурной принадлежности и т. д.) и степень обоснованности выводов в конкретных условиях использования теста. В совокупности сведений содержится информация об адекватности применяемой модели деятельности с точки зрения отражения в ней изучаемой психологической особенности, о степени однородности заданий (субтестов), включенных в тест, их сопоставимости при количественной оценке результатов теста в целом.
В понятие валидности входит большое количество самой разнообразной информации о тесте. Различные категории этих сведений и способы их получения образуют типы валидности.
ДИАГНОСТИЧЕСКАЯ (конкурентная) валидность отражает способность теста дифференцировать испытуемых по изучаемому признаку.
Сведения, характеризующие степень обоснованности и статистической надежности развития исследуемой психологической особенности в будущем, составляют ПРОГНОСТИЧЕСКУЮ валидность методики. С ее помощью можно определить, насколько важен исследуемый признак с точки зрения деятельности испытуемого в будущем с учетом закономерно изменяющихся обстоятельств, перехода на другой уровень развития.
Большинство методик, особенно тестов способностей и интеллекта, исследуются на предмет диагностической и прогностической валидности, нередко объединяемых общим понятием ЭМПИРИЧЕСКОЙ валидности. Этим подчеркивается общность подхода к их определению, который осуществляется путем статистического коррелирования баллов (оценок) по тесту и показателей по внешнему параменту, избранному в качестве валидизации критерия. Критерий валидности выступает в качестве меры, показателя исследуемых психологических особенностей и является независимым от теста показателем, обладающим непосредственной ценностью для определения областей практики. В качестве непосредственных критериев часто используются экспертные оценки и характеристики, данные педагогами, сотрудниками, руководителями лицам, обследованным с помощью валидизируемого теста.
Во многих случаях бывает сложно или невозможно подобрать адекватный критерий валидизации. При этом особую важность приобретает комплекс характеристик, входящих в тип теоретической валидности. При разработке и использовании теста может быть сформулирован ряд гипотез о том, как будет коррелировать исследуемый тест с другим тестом, измеряющим родственные или противоположные психологические характеристики испытуемых. Эти гипотезы выдвигаются на основании теоретических представлений об измеряемых свойствах как о психологическом конструкте. Подтверждение гипотез свидетельствует о теоретической обоснованности методики, или о степени ее КОНСТРУКТНОЙ валидности. Для подтверждения соответствия получаемых с помощью теста результатов теоретическим ожиданиям и закономерностям используется разнообразная информация, в том числе и относящаяся к другим типам валидности.
Валидность СОДЕРЖАТЕЛЬНАЯ — комплекс сведений о репрезентативности заданий теста по отношению к измеряемым свойствам и особенностям. Одним из основных требований при валидизации метода в этом направлении является отражение в содержании теста ключевых сторон изучаемого психологического феномена. Если область поведения или способность очень сложна, то содержательная валидность требует представления в заданиях теста всех важнейших составных элементов исследуемого явления.
Классификация типов валидности в достаточной мере условна, и нередко для различных ее критериев применяются общие методы определения, кроме того, одни и те же исходные данные могут интерпретироваться с точки зрения различных типов валидности.
В психологической диагностике не существует универсального подхода к характеристике валидности. Сведения, входящие в комплекс валидности, можно оценить качественно и количественно (при помощи коэффициента валидности), нередко их можно описать. Однако в силу сложности, комплексности, ситуативности по отношению к конкретным условиям применения методики валидность в целом невозможно измерить, о ней можно лишь судить. Реальная валидность раскрывается только в результате накопления значительного опыта работы с тестами.
Среди задач, стоящих перед психодиагностическим методом, обязательной является психологическая интерпретация изучаемого явления.
Психодиагностический метод в целом конкретизируется в трех основных диагностических подходах, которые применимы практически ко всем имеющимся диагностическим методикам (тестам).
1. Объективный подход, при котором диагностика осуществляется на основе успешности (результативности) и способа (особенностей) выполнения деятельности.
2. Субъективный подход, при котором диагностика осуществляется на основе сведений, сообщаемых о себе, самоописания особенностей личности, поведения в тех или иных ситуациях.
3. Проективный подход, при котором диагностика осуществляется на основе анализа особенностей взаимодействия с внешне нейтральным, безличным материалом, становящимся в силу его известной неопределенности (слабоструктурно-сти) объектом проекции.
Объективный подход к диагностике проявлений человеческой индивидуальности привел к образованию 2 типов методик (тестов), противопоставление которых стало традиционным. Это — тесты личности и тесты интеллекта. Первые направлены на измерение интеллектуальных особенностей личности, вторые — на установление уровня ее интеллектуального развития. Несомненно, что такое обособление сфер личностных проявлений и интеллекта имеет ограниченный, но тем не менее важный для психодиагностики смысл. Сохранение за личностными проявлениями, с одной стороны, и интеллектом — с другой, относительной самостоятельности позволяет более глубоко проникнуть в сущность этих психологических образований. И наконец, известное акцентирование их функционального своеобразия способствовало разработке диагностических методик, ценность которых неоспорима.
Тесты личности, относимые в настоящей классификации к объективному подходу, можно подразделить на тесты действия (целевые личностные тесты) и тесты ситуационные. Диагностика уровня интеллектуального развития представлена многочисленными тестами интеллекта. Кроме того, выделяются еще две значительные группы тестов: тесты специальных способностей и тесты достижений. Субъективный подход представлен многочисленными опросниками, а проективный — разнообразными проективными методиками исследования личности.
Карелин А. А. Большая энциклопедия психологических тестов. – М.: Эксмо, 2007. – 416 с. С. 14-18.