• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Без электронного архива было трудно»

Анастасия Смирнова о том, как в НИУ ВШЭ оцифровывают и хранят фольклор

Из архива фольклорных экспедиций НИУ ВШЭ

Удобно и открыто хранить материалы экспедиций — задача непростая. Изучающие народные традиции исследователи из Высшей школы экономики решили её с помощью современных технологий — создали Электронный фольклорный архив. О том, как это было, что значит собирать и оцифровывать фольклор, и почему навыки такой работы важны у истоков научной карьеры, IQ.HSE поговорил со стажером-исследователем НИУ ВШЭ Анастасией Смирновой, до недавнего времени — сотрудником Научно-учебной лаборатории теоретической и полевой фольклористики факультета гуманитарных наук, где архив придумали и развивают.

 


Анастасия Смирнова,
студентка бакалавриата по программе
«Фундаментальная и компьютерная лингвистика»,
стажер-исследователь Научно-учебной
лаборатории социогуманитарных исследований
Севера и Арктики, в 2019–2020 гг. –
стажер-исследователь Научно-учебной
лаборатории теоретической и полевой
фольклористики НИУ ВШЭ

— Как фольклористы Вышки жили без электронного архива, и зачем он им понадобился?

— Без электронного архива было трудно. Полевые материалы размещались в личных облачных хранилищах экспедиций, то есть в закрытых аккаунтах, доступных только собирателям. Это, конечно, лучше, чем ручной поиск среди бумажных карточек, но по-прежнему долго и затратно: чтобы ознакомиться с информацией и подобрать нужную, например, для статьи, требовалось перечитывать все расшифровки экспедиций.

Электронный архив значительно экономит время и оптимизирует работу — теперь можно сосредоточиться на собственно исследовательской деятельности. При этом основной идеей было создать не только удобный инструмент, но и место хранения, открытое для всех, в том числе для учёных из других городов и стран.

— Когда началась разработка архива?

— Работа под руководством Андрея Борисовича Мороза и Юлии Михайловны Кувшинской ведётся с 2019 года, хотя сама идея появилась гораздо раньше. С 2016-го проводятся фольклорные экспедиции Научно-учебной лаборатории теоретической и полевой фольклористики НИУ ВШЭ. В них исследователи изучают местные традиции, общаются с бабушками и дедушками в сёлах и городах, расспрашивают их, как они жили раньше и как — сейчас, собирают рукописные сборники, заглядывают в архивы и музеи, наблюдают живую традицию там, где это возможно (например, записывают на видео праздники).

За это время накопился внушительный объём информации. Способы её хранения искали долго, пока не появилась программа Фонда образовательных инноваций НИУ ВШЭ «Открываем Россию заново» (проект «Пост-продакшн» по материалам экспедиций).

«Открываем Россию заново» — программа студенческих полевых экспедиций Высшей школы экономики. Под руководством преподавателей студенты погружаются в изучаемую реальность, собирая и анализируя данные о жизни посёлков и малых городов.

Благодаря финансированию, удалось создать качественную базу данных. Материалы из экспедиций теперь не оседают на закрытых площадках, а оцифровываются и становятся доступными всем желающим.

— И что желающие смогут увидеть?

— На сегодня в архиве хранятся материалы из экспедиций, возглавляемых Андреем Морозом и Юлией Кувшинской. Это две разные исследовательские группы. Андрей Борисович руководит экспедицией от Школы филологических наук, Юлия Михайловна — от Школы лингвистики.

Участники первой группы с 2016 года собирают фольклор и описывают систему народных верований в белорусско-русском пограничье. Вторая сосредоточена в основном на народном словесном творчестве с фиксацией мифологических представлений и представлений об истории (с 2017 года состоялись поездки в Тверскую и Ивановскую области).

Общая задача обеих групп — зафиксировать нынешнее состояние традиционной культуры. Для этого проводятся полуструктурированные интервью с местными жителями, то есть беседы по определенным темам с опорой на специально разработанные опросники.

Расшифровки разговоров помещаются в электронный архив. Кроме текстов, есть медиафайлы: фотографии уникальных храмов и домов, резьбы по дереву и вышивки, скульптур, знаков сакральной географии (поклонные кресты, часовни, камни), а также видеозаписи со сказками, песнями, беседами — важный источник для исследований по визуальной (и не только) антропологии.

— Как во всём этом сориентироваться и найти на сайте нужное?

Искать можно по ключевым словам — сейчас их около 1200, жанру — их свыше 70 (анекдоты, былины, тосты, обряды, песни, поговорки и прочее), по году и месту сбора данных (область, район, населённый пункт), сведениям об информантах (гендер, год рождения, место проживания) и опросникам (архив выдаёт страницы с вопросами, которые задавались в экспедициях).

Так как сайт архива создаётся в значительной мере силами студентов и преподавателей Школы лингвистики (возглавляет работу Борис Валерьевич Орехов), сделан и лингвистический поиск (сокращенная версия платформы tsakorpus Тимофея Архангельского), то есть поиск по самим текстам: по лемме — начальной форме слова, по точной форме слова или сочетанию слов.

— Опыт ВШЭ по организации Электронного фольклорного архива уникальный, или подобные проекты уже есть?

— Многие российские научные центры ищут подходы к корпусному изучению фольклора и начинают создавать электронные базы. В своё время были попытки сделать фольклорный подкорпус Национального корпуса русского языка (НКРЯ). Существует Фольклорный архив Института языка, литературы и истории Карельского Научного центра РАН, где можно послушать и почитать записанные песни, сказки, предания и заговоры коренных народов Карелии. Есть очень масштабный цифровой архив хранилища латышского фольклора, где хранятся оцифрованные коллекции Фольклорного архива Латвии.

— В чем тогда особенность проекта Вышки?

— Кроме уже упомянутой разноформатности хранящихся данных — от текстов до видео, также в том, что архив содержит результаты работы двух экспедиционных групп, которые по-разному подходят к сбору и обработке материалов.

— И как разное становится единой базой?

— Записанные на диктофон разговоры расшифровываются. Экспедиционная группа, которая фокусируется на описании системы народных верований, разбив свои тексты на тематические блоки ещё в процессе расшифровки, классифицирует их по вопросам и затем размечает по ключевым словам. Вторая группа — сконцентрированная на народном словесном творчестве, размечает получившиеся тексты по ключевым словам и жанрам. После этого систематизированные расшифровки нарезаются, и, наконец, файлы загружаются в архив.

— Трудно вообще вписывать в него фольклор?

— Научных и методических проблем много. Например, в каком виде представить тексты или насколько подробно их расшифровывать. Если мы изучаем диалект, то необходима фонетическая транскрипция в Praat — программе для анализа речи. Если цель — этнолингвистическое исследование, то достаточно упрощенной транскрипции слов с пропусками пауз хезитации, оговорок и многократных повторов. Если фокус на фольклоре и антропологии, то подойдёт традиционная фольклорная расшифровка, задача которой точно передать мысль, сюжет, детали, но не речь. Кроме того, важен вопрос о разметке — какой она должна быть: по жанрам, действиям, персонажам.

— Структурно архив сформировался. Что дальше?

— Безусловно, развитие, пополнение новыми данными, расширение медиаколлекции. Многие технические детали уже сложились, и теперь можно сосредоточиться на улучшении системы: совершенствовать сайт, архитектуру и оформление кода, оптимизировать пользовательский интерфейс, автоматизировать процессы. Конечно, есть и исследовательские идеи. Например, описание архива с помощью различных методик Digital Humanities и автоматической обработки текста.

— А личные исследовательские планы?

— Работа с фольклором послужила хорошим стартом для моих дальнейших исследований. Сейчас я сотрудник Лаборатории социогуманитарных исследований Севера и Арктики, занимаюсь социальной и лингвистической антропологией. Основной мой интерес — североведение, после окончания бакалавриата планирую более плотно заняться им и языковой политикой.

— Участие в экспедициях продолжается?

— Да, этим летом я ездила в карельскую экспедицию, уже третью в цикле «Этноязыковой ландшафт Русского Севера», а затем началось изучение нового для нас поля — Ижемского района Республики Коми. В этих экспедициях мы в первую очередь исследуем языковую ситуацию, этнокультурный ландшафт региона.

— Представления о России в лекционной аудитории и в полевых условиях: что меняется?

— На мой взгляд, довольно сложно говорить о вещах, которых ты не видела вживую. Например, мне было очень тяжело работать над исследованием о языковой ситуации у коми-ижемцев, опираясь лишь на интернет, открытые источники, литературу. Тяжело, пока не съездила в Ижемский район, не увидела всё своими глазами, не прочувствовала, не пообщалась с местным населением. Сейчас, когда всё это — моё знание, работа выходит сама собой. В целом, экспедиция — замечательный опыт, возможность самостоятельно увидеть, как живут люди, узнать, насколько они потрясающие, внести свой вклад в науку.
IQ

Автор текста: Салтанова Светлана Васильевна, 16 сентября, 2021 г.