Так же дело обстоит с валидизацией теста Роршаха – она бывает менее благоприятной, чем само качество метода. Оказывается, что интроверсия и экстраверсия, определенная с помощью теста Роршаха, отличается от интроверсии и экстраверсии, выявленной с помощью опросников и других часто используемых методов, исходящих из иных теоретических предпосылок.

Позитивисты-эмпирики сказали бы, что критерием является зависимая переменная, с помощью которой мы приблизительно оцениваем, предсказываем на основании результатов теста (диагностических показателей), или переменная, которая служит мерой валидности теста.

В отличие от этого несколько крайнего утверждения мы исходим из предположения, что по диагностическим данным (ДД) мы судим об изучаемой характеристике личности (ХЛ) посредством психометрически или теоретически обоснованного отношения между результатами теста и величиной критерия (К): ДД – К – ХЛ.

Таким образом, можно сказать, что критерий – это очевидный показатель тех характеристик личности, которые тест должен измерять, а именно показатель, определяемый независимо от предъявления теста. Было бы ненаучным, если бы критерий исследовался и выражался – сознательно или неосознанно – в зависимости от знания тестовых результатов отдельных испытуемых.

Считаем необходимым здесь подчеркнуть, не вникая в подробности, что отношение «тест – критерий – характеристика личности» обычно представляет сложную структуру. Выбранный критерий может релевантно выражать лишь определенный компонент этой структуры, причем другой критерий выражает уже следующий аспект. На этой основе – кроме иных факторов – может возникнуть разногласие между различными авторами при определении валидности (слепая валидизация).

Мы уже отмечали, что критерий должен быть очевидным, объективно надежно и легко определимым и по возможности репрезентативным показателем изучаемой характеристики. Критерием может служить и ранее проверенный практический тест или общепринятая хорошая теория.

Критерием может служить и возраст – при условии, что с возрастом регулярно повышаются или снижаются показатели изучаемого явления; иными общеопределенными критериями являются: пол, диагноз врача, отметка в школе, далее, например, разделение испытуемых на «имеющих» и «не имеющих» определенную характеристику, распределение испытуемых по степени выраженности (от максимума до минимума) изучаемой характеристики, применение техники «угадай, кто» и т. п.

Критерии можно разделить в зависимости от того, касаются ли они преимущественно достижений деятельности или постоянных характеристик и объективных обстоятельств.

Группу деятельностных критериев представляет, например, «производительность», выраженная в количестве продуктов, далее качество результата труда, заработок, время, необходимое на овладение деятельностью, и т. д.

К постоянным и объективно данным критериям можно отнести: возраст, пол, количество пропусков на работе, время пребывания на одной работе (на предприятии), текучесть кадров, несчастные случаи, повторение курса обучения, излечение и т. п.

Результаты критерия редко бывают представлены в шкальных единицах (т. е. в интервалах или в равных единицах измерения в системе измерения), чаще всего они представлены в единицах квантиля: это порядковые степени (rating), порядковое место (rankling) или только качественные (номинальные) категории/типы.

Во многих случаях поэтому целесообразно дихотомизировать значение критерия или разделить его на соответствующее количество степеней. Однако дихотомизацию нельзя механически проводить по медиане – ведь мы не знаем, каким на самом деле является распределение значений критерия в исследуемой выборке. Скажем, мы хотели бы с помощью какого-нибудь теста определять индивидов с безошибочным и точным наблюдением. Если мы в качестве критерия возьмем количество пропущенных ошибок в тексте, тогда у половины испытуемых окажется в тесте 0–4 ошибки, а у второй половины 5 и больше ошибок. Но нам нужна группа, которая работает безошибочно (а это только 20 % испытуемых). Высоковероятно, что психические явления не бывают, как правило, распределены по кривой нормального распределения Гаусса. Значит, целесообразно, например, в категорию «имеет характеристику» включить 80 % испытуемых со значением критерия от максимума по уровень, соответствующий 21 %, а в категорию «не имеет характеристики» включить оставшиеся 20 % лиц, и т. п.