Особенности психодиагностического тестирования

Настроить шрифт
Психодиагностический метод отличается опре­деленной спецификой по отношению к традицион­ным исследовательским методам психологии — неэкспериментальному (описательному) и экспе­риментальному.
Основной особенностью его явля­ется измерительно-испытательная направлен­ность, за счет которой достигается количественная (и качественная) квалификация изучаемого явле­ния. Это возможно за счет выполнения определен­ных требований.

Важнейшее из этих требований — СТАНДАР­ТИЗАЦИЯ инструмента измерения, в основе кото­рой лежит понятие нормы, поскольку индивидуаль­ная оценка (например, успешность выполнения того или иного вида задания) может быть получена путем сопоставления с результатами других обсле­дуемых. Благодаря стандартизации методики до­стигается сопоставимость полученных результатов у разных испытуемых, появляется возможность со­поставления таких оценок в разных тестовых мето­диках. В психологической диагностике различают две формы стандартизации:

1)   обработку и регламентацию процедуры прове­дения, унификацию инструкции,  бланков об­следования, способов регистрации результатов, условий проведения обследования, характери­стику контингентов испытуемых;

2)  преобразование нормальной (или искусственно нормализованной) шкалы оценок в новую шка­лу, основанную уже не на количественных эм­пирических значениях изучаемого показателя, а на его относительном месте в распределении результатов в выборке испытуемых. Наиболее распространенными преобразования­ми первичных оценок в психометрике являются центрирование и нормирование посредством средне­квадратичных отклонений. Под центрированием понимается  линейная  трансформация  величин признака, при которой средняя величина распреде­ления становится равной нулю.

В качестве функции нормирования обычно вы­ступает Z-показатель (стандартный показатель), выражающий отклонение индивидуального ре­зультата в единицах, пропорциональных стандарт­ному отклонению единичного нормального распре­деления.

Благодаря возможности подобных преобразо­ваний шкалы, традиционно принятые в психодиаг­ностике и построенные на основе шкалы Z-показателя, становятся сопоставимыми, и возможен переход из одной шкалы в другую с иными показа­телями.

Наиболее существенны также требования, предъявляемые к НАДЕЖНОСТИ и ВАЛИДНОСТИ инструмента измерения, и жесткая регламен­тация процедуры обследования, заключающаяся в точном соблюдении инструкции, строго опреде­ленных способах предъявления стимульного материала, невмешательстве исследователя в деятель­ность испытуемого и т. п.

НАДЕЖНОСТЬ — неотъемлемая характеристи­ка методики, отражающая точность психодиагнос­тических измерений, а также устойчивость резуль­татов теста к действию посторонних случайных факторов.

Результат психологического исследования обыч­но подвержен влиянию большого количества не­учитываемых факторов (таких как эмоциональное состояние и утомление, если они не входят в круг исследуемых характеристик, освещенность, темпе­ратура и другие особенности помещения, в котором проводится исследование, уровень мотивированно­сти испытуемых на исследование и др.) Любое из­менение ситуации исследования усиливает влияние одних и ослабляет воздействие других факторов на результат теста.

Общий разброс (дисперсию) результатов тесто­вого обследования можно, таким образом, предста­вить как результат влияния 2 групп причин: измен­чивости, присущей самому измеряемому свойству, и факторов нестабильности измерительной проце­дуры.

В широком смысле под надежностью понимается характеристика того, в какой степени выявленные у испытуемых различия по тестовым результатам являются отражением действительных различий в измеряемых свойствах и в какой мере они могут быть приписаны случайным ошибкам.

В более узком смысле применительно к методам определения характеристик надежности под этой группой показателей подразумевается степень со­гласованности результатов теста, получаемых при первичном и повторном его применении, по отно­шению к тем же испытуемым в различные момен­ты времени, с использованием разных (но сопоста­вимых по характеру) наборов тестовых заданий или при иных изменениях условий обследования.

Распределение оценок испытуемых при выпол­нении теста, измеряющего одно качество, в идеаль­ном случае совпадает с так называемым нормаль­ным распределением, и дисперсия при этом будет истинной ( т. е. отражающей вариативность только измеряемого признака). Каждый испытуемый зани­мает определенное место по оценкам теста, и теоре­тически это место для каждого члена выборки постоянно. В рассматриваемом случае повторноевыполнение теста теми же лицами должно давать распределение мест на шкале оценок, идентичное первому. Тогда методика как измерительный ин­струмент точна и максимально надежна. Реальные оценки и ранговые места испытуемых при повтор­ном обследовании изменяются, и их распределение в той или иной степени отличается от исходного. При этом дисперсия нового распределения выше исходного на величину дисперсии ошибок изме­рения.

В зависимости от условий, влияющих на резуль­таты теста, выделяют следующие типы характерис­тик надежности.

1.  РЕТЕСТОВАЯ НАДЕЖНОСТЬ определяется путем повторного обследования испытуемых с по­мощью одного и того же теста. Этот показатель вы­числяется по соответствию результатов первого и второго обследований или по сохранению ран­говых мест испытуемых в выборке при ретесте. Коэффициент надежности соответствует коэффициенту корреляции между полученными ре­зультатами.

2.   НАДЕЖНОСТЬ  ПАРАЛЛЕЛЬНЫХ  ФОРМ определяется с помощью взаимозаменяемых форм теста. При этом одни и те же испытуемые обследу­ются вначале с использованием основного набора заданий, а затем — с применением аналогичных дополнительных.  Коэффициент надежности мо­жет быть определен и другим способом: испытуе­мые делятся на примерно равные группы, затем одной из них предлагается форма А теста, а дру­гой — форма Б. Через определенное время (обыч­но не более недели) проводится повторное тести­рование, но в обратном порядке. Такая процедура обследования лишена значительной части недос­татков способа ретестовой надежности. Так как в параллельной форме используется другой по со­держанию материал,  возможность тренировки и запоминания отдельных решений уменьшается. Важнейшим преимуществом данного метода яв­ляется сокращение временного интервала перед повторным обследованием. Коэффициент корре­ляции между результатами первичного и повтор­ного тестирования,  оценивающий как времен­ную стабильность теста (собственно надежность), так и степень соответствия результатов обеих форм теста, является основным показателем дан­ной характеристики надежности. Если формы применяются непосредственно одна за другой, то кор­реляция отражает их взаимозаменяемость.

3. НАДЕЖНОСТЬ ЧАСТЕЙ ТЕСТА — третья ха­рактеристика надежности психодиагностических методик. Этот показатель выявляют путем анализа устойчивости результатов отдельных совокупно­стей тестовых задач или единичных пунктов (зада­ний) теста.

Наиболее распространенным видом надежно­сти частей теста является метод расщепления, суть которого сводится к выполнению испытуемым за­даний из 2 равноценных частей теста.

Обоснованием метода служит вывод о том, что при нормальном или близком к нормальному рас­пределению оценок по полному тесту выполнение любого случайного набора из частей теста даст ана­логичное распределение (при условии, что части од­нородны по характеру заданий, отношению к тесту в целом).

Для оценки надежности этим методом выбира­ются 2 эквивалентные по характеру и степени трудности группы задач. Разделение объема зада­ний теста на сопоставимые части достигается рас­пределением заданий на четные и нечетные (в том случае, если задания четко ранжированы по степе­ни субъективной трудности); разделением пунктов по принципу близости или равенства значений ин­дексов трудности и дискриминативности (такой принцип разделения пригоден для тестов достиже­ний, в которых обязателен ответ испытуемых на все пункты); разделением задач по времени реше­ния каждой из частей (для тестов скорости).

Для испытуемых в выборке вычисляются оцен­ки успешности решений (раздельно для каждой из частей теста), среднеквадратичные отклонения первого и второго рядов оценок и коэффициенты корреляции сравниваемых рядов. Естественно, эти коэффициенты будут характеризовать надежность лишь половины теста.

Характеристика надежности по этому типу име­ет ряд преимуществ по сравнению с рассмотрен­ными выше ретестовой и надежностью параллель­ных форм благодаря отсутствию необходимости в повторном обследовании (снимается влияние многих посторонних факторов, например трени­ровки, запоминания решений и т. п.). В то же время невозможность установить устойчивость результа­тов теста спустя определенное время требует ком-бинирования этого метода с другими типами ха­рактеристики надежности психодиагностической методики.

ВАЛИДНОСТЬ — комплексная характеристика теста, включающая сведения об области исследуе­мых явлений и репрезентативности диагностиче­ской процедуры по отношению к ним.

В наиболее простой и общей формулировке ва-лидность — это понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает.

В стандартных требованиях к педагогическим и психологическим тестам валидность определяет­ся как комплекс сведений о том, относительно ка­ких групп психологических свойств личности мо­гут быть сделаны выводы, а также о степени их обоснованности на основании конкретных тесто­вых оценок или других форм оценивания.

В психологической диагностике валидность — наиболее важная часть информации о методике, включающая данные о степени согласованности результатов теста с другими сведениями об иссле­дуемой личности, полученными из различных ис­точников (теоретических ожиданий, наблюдения, экспертных оценок, по результатам других мето­дик, достоверность которых установлена, и т. д.), суждение об обоснованности прогноза развития исследуемого качества, связи изучаемой области поведения или особенности личности с определен­ными психологическими конструктами. Валидность описывает также конкретную направленность ме­тодики (контингент испытуемых по возрасту, уров­ню образования, социально-культурной принад­лежности и т. д.) и степень обоснованности выводов в конкретных условиях использования те­ста. В совокупности сведений содержится инфор­мация об адекватности применяемой модели дея­тельности с точки зрения отражения в ней изучаемой психологической особенности, о степе­ни однородности заданий (субтестов), включенных в тест, их сопоставимости при количественной оценке результатов теста в целом.

В понятие валидности входит большое количест­во самой разнообразной информации о тесте. Раз­личные категории этих сведений и способы их по­лучения образуют типы валидности.

ДИАГНОСТИЧЕСКАЯ (конкурентная) валид­ность отражает способность теста дифференциро­вать испытуемых по изучаемому признаку.

Сведения, характеризующие степень обосно­ванности и статистической надежности развития исследуемой психологической особенности в буду­щем, составляют ПРОГНОСТИЧЕСКУЮ валид­ность методики. С ее помощью можно определить, насколько важен исследуемый признак с точки зрения деятельности испытуемого в будущем с уче­том закономерно изменяющихся обстоятельств, перехода на другой уровень развития.

Большинство методик, особенно тестов спо­собностей и интеллекта, исследуются на предмет диагностической и прогностической валидности, нередко объединяемых общим понятием ЭМПИ­РИЧЕСКОЙ валидности. Этим подчеркивается общность подхода к их определению, который осуществляется путем статистического коррели­рования баллов (оценок) по тесту и показателей по внешнему параменту, избранному в качестве валидизации критерия. Критерий валидности вы­ступает в качестве меры, показателя исследуемых психологических особенностей и является незави­симым от теста показателем, обладающим непо­средственной ценностью для определения областей практики. В качестве непосредственных критериев часто используются экспертные оценки и характе­ристики, данные педагогами, сотрудниками, руко­водителями лицам, обследованным с помощью валидизируемого теста.

Во многих случаях бывает сложно или невоз­можно подобрать адекватный критерий валиди­зации. При этом особую важность приобретает комплекс характеристик, входящих в тип теоре­тической валидности. При разработке и исполь­зовании теста может быть сформулирован ряд гипотез о том, как будет коррелировать иссле­дуемый тест с другим тестом, измеряющим род­ственные или противоположные психологиче­ские характеристики испытуемых. Эти гипотезы выдвигаются на основании теоретических пред­ставлений об измеряемых свойствах как о психо­логическом конструкте. Подтверждение гипотез свидетельствует о теоретической обоснованно­сти методики, или о степени ее КОНСТРУКТНОЙ валидности. Для подтверждения соответ­ствия получаемых с помощью теста результатов теоретическим ожиданиям и закономерностям ис­пользуется разнообразная информация, в том чис­ле и относящаяся к другим типам валидности.

Валидность СОДЕРЖАТЕЛЬНАЯ — комплекс сведений о репрезентативности заданий теста по от­ношению к измеряемым свойствам и особенностям. Одним из основных требований при валидизации метода в этом направлении является отражение в содержании теста ключевых сторон изучаемого психологического феномена. Если область поведе­ния или способность очень сложна, то содержатель­ная валидность требует представления в заданиях теста всех важнейших составных элементов иссле­дуемого явления.

Классификация типов валидности в достаточ­ной мере условна, и нередко для различных ее кри­териев применяются общие методы определения, кроме того, одни и те же исходные данные могут интерпретироваться с точки зрения различных ти­пов валидности.

В психологической диагностике не существует универсального подхода к характеристике валид­ности. Сведения, входящие в комплекс валидности, можно оценить качественно и количественно (при помощи коэффициента валидности), нередко их можно описать. Однако в силу сложности, комп­лексности, ситуативности по отношению к конк­ретным условиям применения методики валидность в целом невозможно измерить, о ней можно лишь судить. Реальная валидность раскрывается только в результате накопления значительного опыта ра­боты с тестами.

Среди задач, стоящих перед психодиагностиче­ским методом, обязательной является психологиче­ская интерпретация изучаемого явления.

Психодиагностический метод в целом конкре­тизируется в трех основных диагностических под­ходах, которые применимы практически ко всем имеющимся диагностическим методикам (тестам).

1. Объективный подход, при котором диагности­ка осуществляется на основе успешности (резуль­тативности) и способа (особенностей) выполнения деятельности.

2.  Субъективный подход, при котором диагно­стика осуществляется на основе сведений, сообща­емых о себе, самоописания особенностей лично­сти, поведения в тех или иных ситуациях.

3. Проективный подход, при котором диагности­ка осуществляется на основе анализа особеннос­тей взаимодействия с внешне нейтральным, без­личным материалом,  становящимся в силу его известной неопределенности  (слабоструктурно-сти) объектом проекции.

Объективный подход к диагностике проявлений человеческой индивидуальности привел к образова­нию 2 типов методик (тестов), противопоставление которых стало традиционным. Это — тесты личности и тесты интеллекта. Первые направлены на измере­ние интеллектуальных особенностей личности, вто­рые — на установление уровня ее интеллектуального развития. Несомненно, что такое обособление сфер личностных проявлений и интеллекта имеет ограни­ченный, но тем не менее важный для психодиагнос­тики смысл. Сохранение за личностными проявле­ниями, с одной стороны, и интеллектом — с другой, относительной самостоятельности позволяет более глубоко проникнуть в сущность этих психологиче­ских образований. И наконец, известное акценти­рование их функционального своеобразия способ­ствовало разработке диагностических методик, ценность которых неоспорима.

Тесты личности, относимые в настоящей клас­сификации к объективному подходу, можно под­разделить на тесты действия (целевые личностные тесты) и тесты ситуационные. Диагностика уровня интеллектуального развития представлена многочи­сленными тестами интеллекта. Кроме того, выделя­ются еще две значительные группы тестов: тесты специальных способностей и тесты достижений. Субъективный подход представлен многочислен­ными опросниками, а проективный — разнообраз­ными проективными методиками исследования лич­ности.

Карелин А. А. Большая энциклопедия психологических тестов. – М.: Эксмо, 2007. – 416 с. С. 14-18.