Корпус
  • 21 текст
  • 229 200 слов
параллельный, мультимедийный, устный
Корпус: МультиПАРКи | Русский
МультиПАРКи

Мультимедийный параллельный корпус сочетает в себе свойства мультимедийного и параллельного корпусов и предназначен для сопоставительных исследований. Корпус состоит из двух независимых зон, которые отличаются как характером материала, так и способом его организации.


Русский МультиПАРК дает возможность сопоставить разные кино-, теле-, радио- и театральные постановки одной и той же пьесы на русском языке. В настоящее время русский МультиПАРК включает пьесу Н. В. Гоголя «Ревизор», представленную в 9 постановках, пьесы А. П. Чехова «Вишневый сад» и «Дядя Ваня» – в 4 и 5 постановках соответственно. Русский МультиПАРК дает возможность сопоставительного изучения одной и той же реплики, произнесенной разными говорящими в одинаковых обстоятельствах. В результате таких исследований могут быть установлены пределы варьирования различных аспектов звучащей речи и ее жестового сопровождения в зависимости от факторов, связанных с личностью актера, временем и стилем постановки, замыслом режиссера т. д.

Технология подготовки корпуса довольно сложна и напоминает подготовку мультиязычного параллельного корпуса письменных переводов одного и того же текста. В качестве «якорного» текста, с которым сопоставляются все варианты его исполнения, в МультиПАРКе выступает опубликованный текст пьесы. Текст пьесы разрезан на фрагменты, в соответствии с которыми фрагментируется аудио- или видеозапись постановки, а затем каждый аудио- или видеофрагмент выравнивается с его письменным транскриптом. Результаты поиска выдаются в виде кластеров: в каждый кластер входит контекст из печатного текста пьесы, содержащий запрашиваемый элемент, и выровненные с ним фрагменты из всех постановок, сопровождаемые соответствующими клипами.


Англо-русский МультиПАРК включает фрагменты сериалов и фильмов на английском языке с закадровым русским переводом или дубляжем, а также разные постановки пьес – на русском языке и в англоязычной интерпретации. Он дает возможность сравнивать и изучать речевое поведение людей, относящихся к разным культурам, говорящим на разных языках, при этом оказавшихся в сходных ситуациях.

Каждый фильм (оригинал и перевод) разрезан на небольшие фрагменты (клипы). На соответствующие фрагменты разрезаны английские и русские расшифровки этих фрагментов. После этого два клипа (английский и русский) и две расшифровки (английская и русская) выравниваются между собой. Нумерация клипов и текстовых фрагментов совпадает в английском и русском варианте.

Каждый текстовый фрагмент размечен в соответствии со стандартами МУРКО и параллельного корпуса НКРЯ и содержит метатекстовую, морфологическую аннотацию (размечены оригинал и перевод), семантическую аннотацию (русский перевод), акцентологическую аннотацию (русский перевод), социологическую аннотацию (сведения об актере — исполнителе роли и актере дубляжа). На запрос пользователя выдаются две пары клип + текст (на английском и русском языках), в которых выровнены между собой видео- и текстовый ряд. Такая подача материала позволяет вести сопоставительные исследования в области интонации и фонетики, лексики и семантики, фразеологии, синтаксиса, анализировать жестикуляцию в англоязычном дискурсе и с помощью сопоставления полученных данных с данными МУРКО проводить сопоставительные жестикуляционные исследования. Кроме того, этот корпус дает образцы особого вида речевой деятельности на русском языке — перевода аудиовизуальных текстов, который рассматривается как самостоятельный вид переводческой деятельности.

Публикации

Ознакомьтесь со списком научных публикаций о Мультимедийном параллельном корпусе по ссылке: https://ruscorpora.ru/s/aOk2Q. Чтобы найти другие типы публикаций о корпусе, используйте фильтры в разделе «‎Публикации»‎.

Создание корпуса

Задача по созданию мультимедийного параллельного корпуса решалась группой под руководством Е. А. Гришиной при поддержке гранта РФФИ № 14-06-00245, программы Президиума РАН «Корпусная лингвистика», программы ОИФН РАН «Язык и информационные технологии»; дальнейшее развитие корпуса осуществлялось при поддержке программы фундаментальных научных исследований Президиума РАН «Памятники материальной и духовной культуры в современной информационной среде» (2018—2020). Концепция корпуса, принципы отбора материала, система аннотации и технология подготовки базы данных разработаны Е. А. Гришиной. Координация работ и редактирование разметки мультимедийного корпуса осуществлялась Е. А. Гришиной и С. О. Савчук (с 2016 г.). В подготовке текстовых и мультимедийных материалов участвовали Е. А. Гришина, А. А. Курсакова, А. А. Махова, С. О. Савчук, А. М. Соседова. В создании и усовершенствовании программного обеспечения мультимедийного параллельного корпуса в целом (системы поиска, различных видов разметки и др.) на различных этапах работы принимали участие Л. Д. Алексеевский, Д. В. Вылегжанин, А. И. Зобнин, В. Г. Сизов, И. В. Шалыминов.

Обновлено 02.05.2024