Тема: Контент-анализ как количественный метод исследования текстов
1. Определение, категории и этапы контент-анализа.
2. Структурный контент-анализ.
3. Качественный контент-анализ.
Определение, категории и этапы контент-анализа.
Наиболее обширную группу исторических источников составляют развернутые индивидуальные тексты. Как мы знаем, источниковедение не относит нарративные источники к массовым, а значит, они не соответствуют требованиям, предъявляемым к вероятностным событиям и к ним не применимы математические методы. Однако письменный текст имеет статистическую структуру и определенные характеристики, которые в нем содержатся, могут быть описаны с помощью вероятностных законов. Таким образом, в случае необходимости, нарративный источник можно превратить в массовый[1]. В данном случае мы имеем дело с процессом квантификации - выражением качественной информации, содержащейся в источниках с помощью цифр[2].
К примеру, отношение русского крепостного крестьянина к труду может быть охарактеризовано посредством частотного анализа фольклора (сборников пословиц и поговорок), крестьянских челобитных и жалоб. Подсчитав, например, количество пословиц и поговорок, с помощью которых крестьянин определял труд как радость или горе, необходимость или Божью кару, выражал активное или пассивное отношение к труду, заинтересованность в нем или равнодушие, и оценив удельный вес каждой из выделенных групп историк получает определенное основание о суждении о трудовой морали крестьянина[3]. Таким образом, выражая качественные характеристики через их количественное выражение, мы получаем новые данные и в этом случае имеем дело с методом контент-анализа.
|
|
Контент-анализ (буквально «анализ содержания» (англ.)) – это анализ текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей.
Первые примеры использования контент-анализа датированы XVIII в., когда в Швеции частота появления в тексте книги определенных тем служила критерием её еретичности. Однако, всерьёз говорить о применении контент-анализа как полноценной методики можно лишь начиная с 30-х гг. ХХ в. в США. Сам термин content analysis впервые начал применять в конце XIX – нач. XX вв. американский журналист Бреди Мэттью. Первоначально контент-анализ использовался преимущественно в социологических исследованиях, в том числе при изучении рекламных и пропагандистских материалов. Однако со временем этот метод становится достаточно востребованным и среди историков. Причина популярности этого метода в том, что он в очень высокой степени отвечает насущным потребностям историков, его использование не требует углубленного знания математики, но дает хорошие результаты, метод надежен, сравнительно прост и эффективен[4].
|
|
Основными категориями контент-анализа являются[5]:
- единица текста (единица содержания) – сообщение, которое вне зависимости от размеров принимается за единицу,
- смысловая единица (качественная единица, единица анализа) - это проблема, которая выделяется,
- единица счета (зависит от того, фиксируется единица анализа единожды, сколько бы раз она ни повторялась, либо столько раз, сколько она встречается в единице текста[6]),
- индикатор (признак) отношения автора к проблеме[7].
Контент-анализ складывается из двух основных этапов.
На первом, классификационном этапе, исходя из цели и информативного потенциала источников, выделяется совокупность признаков, многократно встречающихся в документах. Здесь происходит формализация документа, вырабатывается некое подобие анкеты. Некоторыми исследователями на данном этапе рекомендуется создать своего рода словарь, в котором каждое наблюдение получит определение и будет отнесено к соответствующему классу[8].
Сложность работы на классификационном этапе состоит не столько в выделении признаков, сколько в определении их градации, подразделений. Это связано со спецификой языка, особенностями словесных характеристик, системой их измерения. Например, один и тот же признак может встречаться в тексте, будучи выражен разными словами-синонимами, иносказаниями, развернутыми описаниями; иметь, в зависимости от контекста, различную эмоциональную и смысловую окраску; принимать и положительные, и отрицательные значения[9]. В качестве единицы анализа текста может выступать тема, выраженная в целой статье, во фрагменте текста, и т.д. до отдельных слов.
В работе с историческими источниками на данном этапе важно учитывать тот факт, что развитие содержания терминов и понятий, зафиксированных в исторических источниках, в общем и целом отстает от развития скрывающегося за ними реального содержания исторических событий. В этом смысле многим историческим терминам присуща архаичность, которая граничит нередко с полным омертвением их содержания. Подобное отставание является для исследователя проблемой, требующей обязательного решения. Так, например, процессы имущественной дифференциации и социального расслоения находят свое выражение в варварских правдах и в соответствующей терминологии, которая, однако, не всегда точно фиксирует развитие этих явлений. Особенно это относится к градациям внутри основной прослойки свободных. Понятие «свобода» при всем его многозначности в отдельных источниках (за исключением Салической правды, где это понятие лишено оттенков — «полная свобода», «неполная свобода») не имеет соответствующих терминов для обозначения различных социальных категорий. В эдикте Ротари особые термины для обозначения рядовых свободных и знати отсутствуют; понятие «знатность» входит в понятие «свобода». Разоряющиеся свободные также терминологически не выделены из общей массы свободных, хотя их положение фактически приближается к положению рабов; для этих различных категорий существует понимание термина «свобода» (libertas), которое не соответствует в полной мере складывавшейся социальной структуре лангобардского общества времен эдикта Ротари. Это объясняется не только неоформленностью самой этой структуры, но и отставанием изменения понятий от развития социальных отношений[10].
В этой связи при выделение единиц анализа возникает несколько ограничений:
1. Слово нельзя рассматривать как ключ к пониманию явления в тех ситуациях, когда термины не ясны. Без предварительного изучения их содержания достичь такого понимания невозможно.
|
|
2. Необходимо учитывать многозначность термина, применяющегося для обозначения различных, отличающихся друг от друга событий или явлений. С этим связана также необходимость рассматривать совокупность терминов, относящихся к одним и тем же событиям, причем для выяснения этой многозначности привлекается возможно более широкий круг источников, в которых она имеет место.
3. С появлением новой терминологии надлежит выяснить, скрывается ли за ней новое содержание или то, которое уже существовало раньше, но под другими названиями[11].
При выборе смысловых единиц также необходимо соблюдать требование их взаимоисключаемости и однопорядковости[12]. (Часто исследователь идет на поводу у источника).
Следующим шагом первого этапа выступает подсчет частоты появления в тексте каждого признака и частоты их смысловых связей. Если есть необходимость определяется частота отношения автора (авторов) текста к полученным единицам анализа.
Таким образом, можно сказать, что на первом этапе контент-анализа решается вопрос «что считать?». Работа здесь не может быть формализована, она определяется методологическими принципами исследователя, уровнем его профессиональной квалификации. В литературе в связи с этим высказано сомнение в объективности контент-анализа. Однако надо заметить, что метод позволяет проследить все шаги исследователя, все этапы его работы и воспроизвести их заново, проверить и перепроверить ее результаты. В этом смысле работы, выполненные на основе контент-анализа, выгодно отличаются от традиционного подхода, когда историк раскрывает свою концепцию, иллюстрируя ее отдельными фрагментами из текста источника. Здесь личная позиция автора в большей мере определяет характер результатов изучения текста и другой историк, обратившись к тому же источнику может получить совсем другие выводы и проиллюстрировать их другими фрагментами из того же текста[13].
На втором этапе решается вопрос «как считать?». В зависимости от характера количественных данных, от частотных классификаций, от группировок определяется процедура расчета показателей по разработанным математико-статистическим методам. Рассмотрим несколько примеров:
|
|
А) Методика контент-анализа дала интересные результаты при обработке ответов на четыре хозяйственные анкеты 60-х гг. XVIII в. В анкету, составленную по предложению Екатерины II вошло 14 вопросов, разослана она была 18 губернаторам и 153 уездным воеводам. Всего анкетой 1767 г. было охвачено 176 уездов (56% всех уездов Российской империи)[14]. В то же время традиционный качественный анализ затруднен большим количеством сохранившихся документов. Изучение содержания каждой анкеты ведет к неминуемой потере информации. Борис Николаевич Миронов в 1972 г. составил возможные варианты ответов на каждый вопрос анкеты (от 5 до 31 варианта для разных вопросов). В результате содержание анкет теперь можно было группировать по разработанным вариантам и определять их частоты. Проделанная работа внесла количественную определенность в вопрос о причинах повышения хлебных цен во второй половине XVIII в. и на некоторые другие вопросы социально-экономической истории России[15].
Б) Анализ слайда.
Таблица по сибирской интеллигенции: данные получены на основе контент-анализа текстов крупнейших газет Западной Сибири в 1917 г. – «беспартийной» «Сибирской жизни», эсеровской «Путь народа» и кадетской «Сибирская речь», которые отражали взгляды всех основных прослоек интеллигенции, составлявших до 2/3 общей численности западно-сибирской интеллигенции.
В) В научный оборот введены «приговоры» и петиции крестьянских сельских сходов в Совет министров, Государственную Думу, царю, Всероссийскому крестьянскому съезду. С помощью контент-анализа Олег Григорьевич Буховец в 1979 г. изучил содержание 72 приговоров и наказов политического характера, принятых крестьянами Самарской губернии в 1905-1906 гг. Классификационный этап завершился формированием 30 категорий требований. Подсчет частоты встречаемости каждой категории в тексте источника показал, что наиболее важными для крестьян были:
1) амнистия политическим заключенным (73% документов),
2) установление демократических свобод (58 %),
3) отмена смертной казни (43%),
4) упразднение земских начальников, полиции, стражников
(39%) и т.д.
Отмена же частной собственности на землю и передача народу частновладельческих, казенных, монастырских, удельных и др. земель - оказалось только на 7-м месте. Аналогичная обработка «приговоров» крестьян Воронежской губернии позволила затем сравнить структуру крестьянского «приговорного» движения в двух губерниях[16].
Третьим этапом контент-анализа является интерпретация полученных результатов. Он наиболее индивидуален и целиком зависит от профессиональной компетентности исследователя.