Поэтому в принципе при поиске единицы контент-анализа можно получить два возможных варианта решения проблемы: – считать за единицу анализа символ. В конечном счете, символ выражается либо в отдельном слове, либо в сочетании слов; – смысловой единицей контент-анализа считать какой-либо объект, о котором имеются высказывания в тексте, или какие-то черты, свойства объекта.
При некоторых обстоятельствах этот объект может быть описан и при помощи одного слова, в других ситуациях – при помощи сочетания нескольких слов, т. е. посредством определенных суждений. Выделение единицы анализа поэтому является весьма непростым делом. Чисто технически поиск единицы контент-анализа требует осуществления следующего действия: отыскания в тексте индикатора выбранных единиц.
2. Отыскание его в тексте требует от исследователя необходимости ограничить на этом этапе свою задачу количественным описанием существующего, а не идеального текста… правильно знать границы возможного применения контент-анализа и просто не допускать его абсолютизации, не ожидать от него результатов, которые он не может дать… нужно научиться действовать конвенционально и иметь отвагу руководствоваться своим мнением. После выполнения этой операции исследователь приступает к следующему этапу.
3. Статистическая обработка. Она заключается в подсчете частоты употребления понятия (при условии учета выделенных индикаторов) или в установлении пропорций между различными группами индикаторов. Характер и направление этих подсчетов определяются целями и задачами исследования.
Одна из важных задач контент-анализа – установление идентичности содержания, вкладываемого в один и тот же термин разными авторами. Существуют специальные способы определения точности употребления понятий в тексте, а также «разложения понятий по степеням».
При анализе содержания мы учитываем в тексте признаки определенных категорий, раскрывающих тему (См., например, в кн. Оценка содержательного разнообразия в школьных сочинениях /Сост Б. А. Еремеев – СПб., 1992.).
Все множество признаков – чаще всего лексических единиц – характеризуется их качественно своеобразным составом – словарем – и устойчивостью. Чем больше состав, тем с большей детализацией раскрывается тема и/или подтема. И тем более конкретно выраженно в тексте представление: конкретное есть синтез многих определений.
Чем больше устойчивость отдельных признаков – лексических единиц, тем более определенно раскрывается тема и/или ее составляющие. Это говорит о большей очевидности для автора соответствующих фрагментов действительности и принятых способов их обозначения в данной ситуации порождения речи. И чем больше частотность лексических единиц, тем надежнее высказывание как акт коммуникации.
Содержательное разнообразие текста тем больше, чем длиннее словарь и чем меньше его устойчивость. С точки зрения психологии, содержательное разнообразие свидетельствует о большей сложности факта сознания, воплощенного в тексте.
Для оценки разнообразия нужен показатель, который учитывал бы соотношение единиц содержания в данном их множестве. Это значит, что нужно учитывать и количество различных единиц, и их частотность, и их общую «массу». Для этого подходит оценка энтропии (Н) по К. Шеннону, в битах[6]:
1 Здесь р – частотность, или относительная частота дан
единицы счета по отношению к их сумме:
L – количество различных единиц (длина словаря). Чем больше различных единиц счета – слов и выражений, раскрывающих тему, – тем больше энтропия Н. Чем реже используется каждая единица, тем больше энтропия