• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

В клике от архива

Информационные системы в изучении истории России

Пермская земская неделя. №2, от 09 января 1914 / Пермская губернская периодика: 1914-1922

В Издательском доме НИУ ВШЭ вышла книга «Исторические информационные системы: теория и практика» историков Сергея КорниенкоНадежды Поврозник и Динары Гагариной. IQ.HSE публикует из неё фрагмент, в котором авторы рассказывают о разработанных ими системах по истории земского самоуправления, губернской периодики и парламентаризма в позднеимперской России. Все они в открытом доступе для всех заинтересованных исследователей.

Большинство из описанных ниже систем — смешанные, совмещающие источнико- и проблемно-ориентированный подходы. Источнико-ориентированный подход позволяет наиболее полно реализовать возможности сохранения, оптимальной организации информации и изучения исторических источников. Проблемно-ориентированный — обеспечивает эффективное решение исследовательских задач и сочетание источников разного вида в пределах одного ресурса. Далее мы покажем, как проектируются подобные системы с учётом их дальнейшего применения для решения исследовательских задач, а также результаты такого использования.

Системы по истории земского самоуправления в России

Среди источников изучения истории земского самоуправления в дореволюционной России ведущая роль принадлежит документам и материалам земского делопроизводства и прежде всего журналам земских собраний, которые вполне можно отнести к массовым историческим источникам. На протяжении всего своего существования все губернские и уездные земства России вели и публиковали журналы. Уже на заре историографии земского самоуправления один из первых историков земства Б.Б. Веселовский указывал на особую значимость журналов земских собраний как исторического источника. Он сам активно использовал их в своем фундаментальном труде по земской истории и сформулировал основополагающее требование к их научному изучению как исторического источника — необходимость систематического, последовательного, комплексного анализа данного типа источников. Нужно изучать их «систематически», «из года в год», — писал Б.Б. Веселовский.

 

Однако реализовать это требование непросто. Отчасти это связано с тем, что такие журналы издавались небольшими тиражами, поэтому их значительная часть сегодня труднодоступна, является библиографической редкостью. Вместе с тем даже тех, что остались, достаточно много — по нашим приблизительным подсчетам, число единиц журналов только губернских земских собраний составляет около 2 тыс., а только очередных сессий уездных земских собраний — не менее 15 тыс. Эти журналы относятся к источникам, которые содержат большой объем информации на темы самого различного характера. В этом смысле их использование требует весьма развитой системы поиска, отбора и организации данных. Возможности создания такой системы на основе традиционных технологий ограничены ресурсами человеческой памяти, которая может удерживать информацию о достаточно продолжительных процессах, явлениях, событиях.

В то же время внедрение сегодня в гуманитарные (в том числе и исторические) исследования информационных технологий создает возможности для преодоления указанных трудностей и реализации познавательных принципов научного изучения этого основного вида источников земской истории. Один из путей для этого — создание научно-образовательных комплексов нового типа на основе историко-ориентированных информационных систем.

Именно таким комплексом стала полнотекстовая информационная система «Журналы земских собраний (вторая половина XIX — начало XX в.)». Проектирование этой системы осуществлено на основе источнико-ориентированного подхода. Оцифрованные и переведенные в машиночитаемый формат исторические источники — журналы губернских земских собраний — организованы под управлением реляционной СУБД и структурированы соответственно модели самого источника. Источнико-ориентированный подход позволяет в наиболее полном виде сохранить информацию источника, обеспечивая возможность осуществления многозадачных исследований.
 

Создание такой информационной системы прежде всего обеспечивает системную организацию источников, их объединение в рамках источникового комплекса, доступ ко всему их массиву и возможность машинной обработки. Организация источников под управлением СУБД дает возможность аналитической обработки данных средствами самой СУБД, прежде всего применения технологии запросов к базе данных. В то же время создание источнико-ориентированной информационной системы расширяет арсенал методов анализа данных источников. Открываются возможности анализа ранее недоступных объемов данных, их тематических выборок, трансформации текстовых данных в количественные показатели. Это создает принципиально новые возможности для анализа информации статистическими методами, применения методов сетевого моделирования, построения семантических сетей, контент-анализа, просопографии, а также для репрезентации данных исторических источников и результатов их обработки и интерпретации.

На основе созданной информационной системы были выявлены и изучены в комплексе основные направления деятельности отдельных земских учреждений и губернских земств в целом; более точно установлены соотношение между их различными видами и динамика их развития; разработана классификация губернских земств и их учреждений по параметрам их состояния и деятельности. Использование этой системы открыло новые возможности для изучения состава и группировок земских деятелей, получения их коллективных портретов, более глубокой и полной характеристики провинциальных элит и процессов их формирования, представлений о процессах горизонтальной и вертикальной мобильности среди земцев, активности и роли тех или иных деятелей земств и др.

Так, информационная система «Журналы земских собраний» стала основой для получения данных о гласных губернских земских собраний. Подобное исследование было выполнено Н.Г. Горбачевой (Поврозник). В результате были получены социокультурные и деятельностные характеристики гласных, выявлено наличие взаимосвязей между ними, определены сравнительные характеристики и группировки гласных по различным критериям на разных этапах и в целом. Применение методов организации и компьютеризированной обработки данных журналов земских собраний открыло уникальную возможность получать информацию из этих журналов как единого текста в рамках всего их массива, погубернских и поуездных его долей, на протяжении всего периода земской истории и ее отдельных этапов. На основе и с использованием системы «Журналы земских собраний» проведены исследования, посвященные земской истории и историографии земского самоуправления; обсуждению земствами вопросов Первой мировой войны; изучению состава и характеристик земских гласных и чиновников, типов их поведенческой активности; роли органов власти в организации и проведении выборов в земское самоуправление.

Все вышеизложенные возможности исторических информационных систем как средства поддержки исследований по истории земского самоуправления еще более полно раскрылись в новом исследовательском проекте «Социокультурный облик и модели поведения гласных губернских земских собраний (на материалах Московского, Санкт-Петербургского и Пермского земства второй половины XIX века)». Для реализации этого проекта была создана информационная система со свободным онлайн-доступом «Земское самоуправление в России», содержащая данные и инструментарий для исследования социокультурных и деятельностных характеристик земских гласных с целью получения соответствующих моделей и изучения взаимосвязи между ними.

В результате реализации проекта выявлены, проанализированы и описаны на вербальном и статистическом уровнях модели социокультурного облика и поведения гласных земских собраний Московской, Санкт-Петербургской и Пермской губерний первого трехлетия деятельности; связи между этими моделями; проявления влияния моделей социокультурного облика на модели поведения; социально-культурные факторы, влияющие на модели поведения. На основе построения социальных и семантических сетей прослежены процессы образования групп и взаимодействие гласных в земстве. Кроме того, определены факторы, влияющие на формирование групп; степень стабильности групп гласных с общими моделями поведения; частота и факторы, влияющие на изменение модели поведения гласных. Проведенное исследование позволило выявить факторы, влиявшие на принятие решений в земстве и на эффективность функционирования земских собраний.

Системы на основе губернской периодики

Одним из источников, достаточно широко используемым в региональных исследованиях по истории России, является губернская периодическая печать. Однако введение ее в научный оборот затруднено рядом обстоятельств. Нередко коллекции газет и их отдельные части рассредоточены в разных учреждениях хранения, что создает проблему доступа к источнику и его полноты. Другое обстоятельство связано с технологическими сторонами происхождения, бытования и особенностями хранения региональной периодической печати. Полиграфическое оборудование и бумага, на которых печатались провинциальные газеты, были, как правило, невысокого качества, а порой и просто плохими. Например, в Пермском краевом музее на грани физического разрушения оказалась часть коллекции газеты «Пермские губернские ведомости»; дальнейшее предоставление ее исследователям стало невозможным из-за угрозы полной утраты. Что касается условий хранения, то такая уникальная коллекция, как газеты, издававшиеся в Перми в период ее оккупации колчаковскими войсками, в советский период сохранилась скорее благодаря нарушению правил хранения. Коллекции газет на долгое время были спрятаны в хранилищах, не ставились на учет, не реставрировались, но именно поэтому дошли до нас и не были уничтожены. Однако в силу плохих условий хранения в сочетании с тяжелыми обстоятельствами, в которых эти газеты выпускались в эпоху Гражданской войны, их состояние критическое и велика угроза утраты.

Решение обозначенных проблем сохранения губернской периодики и обеспечения доступа к ней также осуществляется на основе перевода материалов в электронный формат и создания источнико-ориентированных информационных систем. Разработка таких систем создает и новые исследовательские возможности.

Система «Пермские губернские ведомости» предназначена для хранения и визуализации электронных версий номеров газеты за 1838–1844 и 1909–1913 гг. постатейно и постранично, в формате изображений и электронного текста. Она дает возможность осуществлять поиск и получать выборки по рубрикам, типам публикаций, авторам и другим персоналиям, названиям, заданным параметрам контекстного поиска. Получаемые результаты позволяют вести не только содержательный анализ, но и могут быть легко представлены в численных показателях, что обеспечивает возможность применения при изучении источника количественных методов. Как и большинство источнико-ориентированных полнотекстовых систем, эта система предоставляет возможность анализа содержащихся в ней источниковых массивов и их фрагментов как единого текста.

Указанные возможности были реализованы Р.В. Митиной в комплексном источниковедческом исследовании газеты «Пермские губернские ведомости». Применение методов статистического и контент-анализа, основанных на возможностях информационной системы, позволило Е.А. Кузнецовой рассматривать проблему рекламных объявлений как источник для изучения экономической и социальной динамики, развития образования, сферы услуг и других процессов в пермском обществе.

Аналогичными возможностями обладают информационные системы, созданные на основе газет, выпускавшихся в годы Первой мировой войны и в период оккупации Перми колчаковскими войсками.

Так, информационная система «Пермские газеты колчаковского периода» содержит электронные версии 241 номера таких малоизвестных изданий, как «Освобождение России», «Свободная Пермь», «Современная Пермь», «Отечество», за непродолжительный, но важный в истории Гражданской войны период оккупации территории Пермской губернии войсками адмирала Колчака — с 24 декабря 1918 г. по 1 июля 1919 г. Каждый выпуск газеты представлен постранично в формате pdf (текст под изображением), благодаря чему удалось максимально полно сохранить содержание газет и их внешний облик. Наличие распознанного текстового слоя позволяет осуществлять контекстный поиск и компьютеризированный контент-анализ. На основе данной информационной системы изучается освещение в пермской периодике истории деятельности «Омского правительства» адмирала Колчака, военных действий, работы органов местного самоуправления, политической борьбы и повседневной жизни в Перми и Пермской губернии в годы Гражданской войны.

Другая информационная система — «Первая мировая война в Пермской губернской периодике» — позволяет сохранить и организовать в рамках единой коллекции более 10 наименований газетных изданий, насчитывающих свыше 2 тыс. номеров. Система дает возможность применить традиционные и компьютеризированные методы для изучения таких вопросов, как отношение к войне различных слоев пермского общества и отдельных его представителей; оценка сил и действий России, ее союзников и противников; освещение в пермских газетах ключевых военных событий; роль отдельных полководцев; деятельность Николая II; события в Пермской губернии и ее уездах, связанные с Первой мировой войной, и их последствия; создание образов войны; повседневная жизнь в тылу и на фронте и др.

В ходе реализации проекта по источниковедческому анализу пермской газетной периодики периода Октябрьской революции 1917 г. и Гражданской войны большинство информационных систем, созданных ранее на основе газет, были объединены в ресурс «Пермская губернская периодика: 1914–1922».

Эта информационная система обеспечивает исследователям свободный доступ к изображениям и полным текстам коллекций 13 наименований газет, издававшихся в Пермской губернии в периоды императорской России, Октябрьской революции 1917 г. и Гражданской войны, представленных различными идейно-политическими течениями. Это официальные периодические издания губернской администрации имперской России («Пермские губернские ведомости»), периода Октябрьской революции 1917 г. и власти Временного правительства («Вестник Пермского края», «Пермский вестник Временного правительства»); официальные газеты советов различных уровней (губернского — «Известия Пермского губернского комитета»; отраслевого — «Известия исполнительного комитета Совета железнодорожных депутатов Пермской железной дороги»; уездного — «Известия Осинского исполнительного комитета Совета крестьянских, рабочих и солдатских депутатов»); еженедельник «Пермская земская неделя» — официальный орган печати Пермского губернского земства и др.

Отличительной чертой провинциальной газетной периодики являются содержательное многообразие и разнообразие типов публикаций. В официальных и неофициальных газетах публиковались полные тексты нормативных актов органов власти разного уровня, официальные объявления и телеграммы, справочные и информационные материалы, статьи, заметки, фельетоны и другие данные по наиболее актуальным вопросам социально-экономической, политической, научной и культурной жизни страны и региона. Это были обращения правительства, законы и законопроекты, распоряжения, дипломатические ноты, информация с фронтов Первой мировой войны, а также отчеты о заседаниях правительства, Временного комитета Государственной Думы, Государственного совещания и других учреждений, в том числе губернских и уездных органов власти, местных общественных организаций. На страницах газет также печатались материалы по местной истории, географии, статистике и этнографии.

Созданная информационная система позволяет сохранить и организовать источники в рамках единой коллекции. В настоящее время в систему введено 2,3 тыс. номеров газет и более 6 тыс. документированных статей (ввод продолжается).

На сайте предоставляется исследовательский инструментарий для реализации проблемно-тематических запросов. В частности, предусмотрена возможность просмотра публикаций заданного типа или рубрики. В результате такого запроса пользователь получает таблицу, включающую гиперактивный список публикаций с указанием даты и наименования издания.

Расширенный поиск позволяет выбирать публикации по любой комбинации условий: газета, период, рубрика, тип публикации, а также по встречающимся в тексте топонимам и персоналиям, ключевым словам. В настоящее время в системе имеются данные по более чем 2,7 тыс. персоналий и более чем 2,8 тыс. топонимов. Также можно вести полнотекстовый поиск по названиям и тексту распознанных публикаций.

Поиск по периодам предполагает выдачу списка газет, издававшихся в заданный период (указываются начальная и конечная даты). Это позволяет просмотреть динамику изданий, их разнообразие и т.п. Выдача информации является гиперактивной, по ссылкам можно перейти к соответствующей газете и ее выпускам.

Организация и структурирование источников, созданный поисковый инструментарий и средства визуализации информации позволяют получать данные по самому широкому кругу вопросов жизни и деятельности населения региона в период Первой мировой войны, Октябрьской революции 1917 г. и Гражданской войны.

Поскольку на страницах изданий поднимались не только региональные, но также общероссийские и мировые вопросы, система открывает широкие возможности для изучения международной ситуации и того, как те или иные события и страны воспринимались из Пермской губернии. Примером такого исследования является анализ содержания и динамики образа Японии в пермской губернской периодике в годы Первой мировой войны, проведенный Ю.В. Ященко и Д.А. Гагариной. В ходе исследования изучены публикации 7 наименований газет, найдено более 90 статей, в которых обсуждается или упоминается Япония. В основном это небольшие статьи военной тематики. Анализ показал, что в пермской периодике единого взгляда на Японию не было, хотя не было и значительных различий.

И на досоветском, и на советском этапах наблюдается неоднозначная интерпретация Японии, зависящая во многом от содержания конкретного сюжета. Как правило, информация носила нейтральный характер, исключение составляло рассмотрение проблемных вопросов, в частности Китая и территориального спора. К концу 1917 — началу 1918 г. статьи стали транслировать более негативное восприятие, больше внимания уделялось внешней политике Японии и ее критике, агрессивности Японии и возможной угрозе с ее стороны для других государств.

Таким образом, информационная система «Пермская губернская периодика: 1914–1922» способна обеспечить поддержку исследований в различных гуманитарных науках на уровне доступа к данным, информационного поиска, аналитической обработки данных с помощью выборок и группировок. Созданная система хотя и ориентирована на изучение тематики определенных периодов, тем не менее является источнико-ориентированной и может служить основой для проведения исследований по другим темам, которые освещались на страницах газет в период 1914–1922 гг. Она обеспечивает новые возможности в оценке информационного потенциала источников, полноты, репрезентативности и достоверности пермской газетной периодики, а также в применении методов компьютерной обработки, получения новых данных для научных гуманитарных исследований.

Применительно к описанным информационным системам газетной периодики разработана методика их использования для решения исследовательских задач. Она основана на различных типах запросов к базам данных систем и получении количественных характеристик и тематических выборок. Реализация таких запросов позволяет определять наиболее часто используемые типы и жанры, предметно-тематическую направленность публикаций и их соотношение; вести информационный поиск; формировать текстовые фрагменты и интерпретировать полученные результаты с точки зрения информационной полноты источника и характера информации.

Парламентская история позднеимперской России

На протяжении уже более двух десятилетий парламентская проблематика — история Государственной Думы и Государственного Совета — является одной из ведущих в политической истории России. Это связано не только с историческими юбилейными датами этих институций, но и с потребностями формирования нового государственного и политического устройства современной России, его совершенствования. Интерес к парламентской проблематике поставил на повестку дня вопросы формирования современной источниковой базы, развития научных исследований, создания образовательных и просветительных информационных ресурсов по указанной тематике. В условиях ускорения темпов информатизации это не могло не выразиться в появлении соответствующих цифровых проектов и проведении исследований с применением компьютерных технологий.

Среди таковых и ряд проектов, в реализации которых с 2003 г. принимали участие авторы данной книги. В 2003 и 2004 гг. разрабатывался проект «Российские парламентарии начала XX в.»; в 2008–2010 гг. — «Стенографические отчеты Государственной Думы, 1906–1917»; в 2011–2013 гг. осуществлялись объединение результатов предыдущих проектов и создание научно-образовательного портала «Парламентская история позднеимперской России».

Реализация указанных проектов была направлена прежде всего на создание современного источникового комплекса и такую организацию данных источников, которая позволила бы применять компьютеризованные методы их обработки. Так, на этапе выполнения двух первых проектов были оцифрованы и переведены в машиночитаемый формат основные источники по парламентской истории позднеимперской России — стенографические отчеты Государственной Думы и указатели к ним. Данные машиночитаемых версий источников были структурированы и организованы с помощью СУБД Oracle, которая с самого начала работы по этой тематике стала основой для создания информационной системы. Использование кроссплатформенной технологии обеспечило возможность сетевой работы с данными с помощью браузеров, а также доступ к ним через Интернет.

На протяжении работы над проектами осуществлялось совершенствование модели информационной системы, что позволило наращивать ее информационную полноту и функциональность. В настоящее время источниковая основа портала имеет в качестве самостоятельных информационных объектов историографический и источниковый модули, которые включают в себя гиперактивные библиографические списки, обеспечивающие доступ к полным текстам источников или публикаций, размещенных как в системе, так и вне ее в Интернете. Таким образом, в организации данных источников и публикаций портала положено начало формированию вокруг него семантической сети и в ее рамках возможности глобальных связей и доступа к информации в области парламентской истории.

С точки зрения основ информационного моделирования система «Парламентская история позднеимперской России» — пример использования смешанного подхода, при котором сочетается структурирование информации как на основе модели предметной области, так и на основе моделей основных источников для ее изучения. Наряду с ранее отмеченной функцией организации данных источников по парламентской истории и обеспечения доступа к ним, одной из основных функций системы является организация и представление информации о депутатском корпусе Государственной Думы и выборной части членов Государственного Совета Российской империи 1906–1917 гг. на уровне отдельных персоналий, групп депутатов по отдельным созывам и парламентским учреждениям, а также по всему депутатскому корпусу в целом.

Структура информационной модели объекта «депутат» или «выборный член Государственного Совета» основана на модели основного источника данных о них — указателей к стенографическим отчетам и прежде всего их разделов — личных алфавитных указателей. О каждом депутате Государственной Думы или выборном члене Государственного Совета содержится информация по двум параметрам — его демографические и иные социокультурные показатели, а также основные показатели его парламентской деятельности. Такое структурирование данных обеспечивает возможность проведения исследований в оптике как микро-, так и макроуровня, как на уровне персоналий, так и на уровне группировок по различным признакам и их совокупностям, а также депутатского корпуса в целом. Для подобных исследований в системе создан специальный инструмент — «просопографическое исследование».

Следует отметить, что сочетание социокультурных и деятельностных данных персоналий позволяет осуществлять исследования, раскрывающие их связи и зависимости. Информация о персоналии также структурирована соответственно парламентскому учреждению и его подразделениям, к которым персоналия имела отношение. Для этого использовано структурирование информации на основе проблемно-ориентированной модели парламентских учреждений и их подразделений. В этом смысле определенное удобство представляет тот факт, что изначально структура такого основного источника информации о деятельности Государственной Думы и Государственного Совета, как стенографические отчеты, представляла аналог порядка работы этих учреждений. Публикации стенографических отчетов структурированы по созывам, сессиям и заседаниям, а внутри заседаний, как принято в такого рода документах, — по основным вопросам повестки дня, по ораторам и т.д.

Отмеченные и другие характерные черты модели информационной системы, ее проектирования, организации данных в ней определялись задачами, решаемыми в том или ином проекте, а также функциями, которые должно было обеспечить создание системы. В то же время они могли изменяться от проекта к проекту, и в этом случае были необходимы гибкость модели и возможность развития компонентов системы. Опыт создания и поддержки системы «Парламентская история позднеимперской России» показывает эффективность применения смешанного подхода при проектировании и разработке моделей системы и ее компонентов, сочетания проблемно-ориентированного и источнико-ориентированного подходов.

Востребованность и эффективность этой системы подтверждаются все большим количеством и разнообразием исследований, проводимых с ее использованием. Среди них работы источниковедческого характера, раскрывающие информационный потенциал основных источников по парламентской истории дореволюционной России и возможности применения для этого методов и инструментария информационных технологий. На основе рассматриваемой системы были выполнены исследования по составу депутатского корпуса, характеристике его социокультурного облика, парламентской деятельности и политического поведения.

Организация информации в системе, возможности реализации методов просопографии и трансформации текстовых данных источников в количественные показатели на основе технологии баз данных позволяют применять количественные методы (многомерный статистический анализ) и выводить на уровень статистических закономерностей обоснование результатов исследований. Именно этим отличаются работы, выполненные по тематике запросной деятельности, а также по анализу профессиональной структуры депутатского корпуса Государственной Думы. Возможности получения данных о результатах избрания в депутаты по губерниям России были использованы при изучении электоральных процессов при выборах в III Государственную Думу Российской империи; это исследование проводилось с использованием геоинформационных систем.

В 2016–2018 гг. портал стал информационной основой и инструментом реализации исследовательского проекта «Формирование парламентской субэлиты в позднеимперской России». На его основе осуществлены выборка, организация и визуализация данных, их анализ. В специальном разделе портала размещены полученные результаты, характеризующие категории депутатов с повторным статусом избрания в формирующемся парламентском корпусе Российской империи, а также их численность и персональную принадлежность. С помощью выборок были получены необходимые количественные данные для анализа социокультурного облика и парламентской активности депутатов в целом и группы, отнесенной к категории субэлиты (парламентарии с повторяющимся статусом избрания в Государственную Думу и Государственный Совет). Методами многомерного статистического анализа установлена связь между этими показателями.

В результате впервые выявлены основные социокультурные факторы, характерные для группы субэлиты, а также модели ее социокультурного облика и парламентской активности. Использование возможностей портала «Парламентская история позднеимперской России» для изучения формирования парламентской субэлиты в позднеимперской России и ее анализа подтвердило эффективность исторических информационных систем как средства поддержки научных исследований проблем парламентской истории России.
IQ

18 февраля