Инструкция по работе с мультимедийным корпусом

English

Мультимедийный русский корпус (МУРКО) – это подкорпус Национального корпуса русского языка, который содержит устные русские тексты, выровненные с соответствующими аудио- и видеофрагментами. МУРКО позволяет изучать устную речь, используя не только ее письменную фиксацию, но и ее реальное звучание и жестовое сопровождение. МУРКО рассчитан, прежде всего, на фонетистов, интонологов, специалистов по жестикуляции, но будет также полезен преподавателям русского языка, прежде всего, как иностранного.

Краткий список терминов

Кликст — пара клип + текст расшифровки имеющейся в клипе речи; кликст является основной единицей выдачи материала в МУРКО. В случае если в клипе не содержится речи, а только вокальные и телесные жесты, единицей выдачи в МУРКО является клип.

Автопрерывание — ситуация, когда речевой акт или жест прерываются самим говорящим или жестикулирующим.

Адаптор — некоторый предмет или объект, не являющийся частью человеческого тела, который представляет собой необходимую составляющую данного жеста и без которого жест не может быть осуществлен (например, адаптор внешний объект для указательного жеста). Одним из важнейших адапторов в жестикуляции является собеседник.

Аксессуары — любые предметы, участвующие в осуществлении данного жеста (удлинители, спойлеры и нейтральные объекты).

Активный орган — та часть основного органа, которая, собственно, и осуществляет жест (обычно это наиболее подвижный в момент осуществления жеста орган человеческого тела). При крайней редукции жеста последний сводится именно к движению активного органа. Каждый жест осуществляется каким-либо активным органом, следовательно, указание на активный орган является необходимой составляющей объективного описания любого жеста.

Аутентичность жеста — степень принадлежности жеста говорящему и степень искренности говорящего при осуществлении жеста.

Ввод информации — речевой акт, который предупреждает слушающего о том, что далее говорящий намерен что-либо сообщить, приказать и прочее; введение последующего речевого акта.

Вопрос обратной связи — вопрос, который побуждает слушающего подтвердить либо сказанное ранее, либо тот факт, что слушающий находится в контакте с говорящим.

Говорение с расстановкой — говорение с удлиненными межсловными паузами.

Двойное начало — ситуация, когда некоторое слово произносится говорящим целиком со второй попытки.

Дистанцирование — речевой акт и значение одного из жестов внутреннего состояния, которые отражают отстранение говорящего от какого-либо высказывания и события, нежелание говорящего иметь с высказыванием или событием что-либо общее.

Жест вместо слова — ситуация, когда высказывание заканчивается изобразительным жестом, который замещает опущенную часть высказывания.

Зеркальный жест — повтор одним из собеседников жеста другого собеседника.

Игровой жест — жесты, осуществляемые говорящим в момент исполнения музыкального произведения или художественной декламации.

Косвенные вопросы — любые речевые акты, осуществляемые в форме вопроса, но по сути вопросами не являющиеся (например, просьба Вы меня не пропустите?).

Модальные высказывания — речевые акты, отражающие то или иное отношение говорящего к действительности (например, жалоба, мнение).

Незаконченное высказывание — ситуация, когда говорящий не заканчивает реплику, считая, что ее окончание ясно из контекста и абсолютно предсказуемо.

Нечленораздельный вопрос — вопрос, осуществленный в форме нечленораздельного вокального жеста или бормотания.

Общие вопросы — вопросы, на которые можно дать ответы «да» и «нет».

Основной орган — зона человеческого тела, в которой происходит жестикуляция: голова, корпус, рука (отдельная), руки (обе), нога (отдельная), ноги (обе). Каждый основной орган имеет свой набор активных органов.

Парцелляция — манера речи, при которой межсловные паузы заменяются межфразовыми.

Пассивный орган — орган или часть человеческого тела, которые участвуют в жестикуляции пассивно, чаще всего являются неподвижными или слабоподвижными. Жесты могут осуществляться без участия пассивного органа.

Пейоративные речевые акты, пейоративные жесты — речевые акты и жесты, включающие в свое значение ту или иную форму осуждения адресата.

Перформативы — речевые акты, осуществление которых является неречевым действием (например, клятва).

Показывать на себе — жестовая ситуация, когда говорящий передает чужую речь и на себе показывает сопровождающие ее жесты.

Прерывание — ситуация, когда речевой акт или жест прерывают какие-то внешние обстоятельства.

Продолженное высказывание — ситуация, когда второй говорящий заканчивает реплику, начатую первым говорящим.

Рамочный повтор — повтор, обрамляющий высказывание (Ненавижу тебя, ненавижу!).

Редуцированный жест — жест, осуществленный не в полном объеме.

Скандирование — манера речи, при которой слова разбиваются на слоги.

Собеседник (в жестикуляции) — адаптор; любой субъект, к которому обращен данный жест, т.е. субъект, являющийся адресатом данного жеста (следовательно, собеседник в этом понимании может не производить высказывания и даже не являться участником данной конкретной коммуникации).

Спойлер — любой предмет, мешающий осуществлению данного жеста.

Трансформированный жест — жест, который по ходу осуществления превращается в другой жест или другое движение.

Удлинитель — любой предмет, участвующий в осуществлении жеста и при этом замещающий собой целиком или частично активный орган.

Частные вопросы — вопросы, на которые можно дать только содержательный ответ, но не ответы «да» или «нет».

Чревовещание — манера речи, при которой говорящий старается как можно меньше шевелить губами.

Эстафета — повтор конечной части предшествующего высказывания в начале последующего (Я боюсь. Боюсь остаться в одиночестве).

Этикетный вопрос — косвенный вопрос, используемый в этикетных ситуациях, а также любые этикетные речевые действия, облекаемые в форму вопроса (например, С кем имею честь? в ситуации знакомства).

Эхо — повтор части высказывания первого говорящего вторым говорящим (— Это очень плохо. — Очень плохо...).

Как задать свой подкорпус?

На главной странице поиска нужно щелкнуть мышкой по закладке «задать подкорпус»:

После этого откроется окно выбора подкорпуса. Здесь можно выбрать основные параметры нужного вам текста (автор, название, год создания, пол и год рождения автора). Кроме того, выбрать тип и жанр текста (например, разные типы устной речи):

На этой же странице можно выбрать подкорпус по социологическим характеристикам участвующих в кликсте говорящих (по имени – для актеров, по возрасту, году рождения, полу):

После того, как нужный вам подкорпус задан, щелкните по одной из кнопок внизу страницы:

Если вы щелкнете по «Очистить», то все выбранные вами позиции будут отменены и вы сможете снова выбрать нужные вам характеристики подкорпуса. Если вы щелкнете по «Очистить подкорпус», то будет выполнена команда «Очистить», т.е. весь предыдущий выбор будет отменен, и при этом вы будете перемещены на основную страницу поиска, где сможете осуществлять поиск по всему Мультимедийному русскому корпусу, а не по своему подкорпусу. Если вы щелкнете по кнопке «Далее», то выбор вашего подкорпуса будет сохранен, а вы будете перемещены на следующую страницу, где сможете конкретно оценить, какие именно кликсты попали в ваш выбор:

Если вас удовлетворяет полученный список, то вы щелкаете по кнопке «Сохранить подкорпус и перейти к странице поиска», если же вас список не удовлетворяет, вы выбираете закладку «выбрать подкорпус» и снова попадаете на страницу «Выбрать подкорпус». Далее поиск производится по выбранному вами подкорпусу.

Основная страница поиска в МУРКО

Основная страница поиска в Мультимедийном русском корпусе устроена так же, как и в остальных модулях Национального корпуса русского языка, но имеет дополнительные параметры, которые расширяют возможности поиска нужных кликстов.

Как задать точный поиск?

Строка точного поиска устроена в МУРКО так же, как и в акцентологическом подкорпусе НКРЯ, а именно, здесь можно искать точные формы слова с различением места ударения и букв «е» и «ё». Таким образом, на запрос «полу'чите» будут выданы только формы будущего времени глагола «получить», а на запрос «получи'те» – только формы императива. Аналогичным образом будут различены при выдаче словоформы «черт» и «чёрт»:

После набора искомой формы вам следует щелкнуть по кнопке «Искать».

Напомним, что в случае, если у вас нет русской раскладки клавиатуры, то для набора необходимой формы вы можете воспользоваться виртуальной клавиатурой, щелкнув по кнопке АБВ рядом со строкой поиска.

Как задать параметры лексико-грамматического и семантического поиска?

Для того, чтобы найти все формы данного слова, наберите исходную форму слова в ячейке леммы в зоне «Лексико-грамматический поиск»:

В случае, если вы хотите найти словосочетание, укажите первый его элемент в первой строке, второй — во второй. Если вам нужно словосочетание из трех и более слов, нажмите стрелку вниз рядом со второй строкой, и появится третья строка.

Степень контактности элементов словосочетания определяется параметром «Расстояние». По умолчанию расстояние равно нулю.

Для того, чтобы задать поиск грамматических признаков, щелкните на кнопке «выбрать», перед вами откроется диалоговое окно, в котором вы сможете выбрать нужные характеристики:

Выберите нужные параметры и нажмите кнопку OK.

Аналогичным образом, для того, чтобы выбрать семантические признаки, щелкните на кнопке «выбрать» и, выбрав нужные параметры в диалоговом окне, щелкните по кнопке OK:

Вы можете уточнить ваш запрос, используя дополнительные признаки (знаки препинания, заглавные буквы, повторы):

Дополнительные признаки в случае необходимости задаются для каждого слова словосочетания.

По завершении действий, описанных в пункте 2.2, щелкните по кнопке «Искать»:

Поиск по орфоэпической разметке

В МУРКО при каждом словоупотреблении размечены имеющиеся в нем сочетания согласных и гласных букв, которые могут представлять интерес для исследований, касающихся норм произношения сочетаний звуков.

В МУРКО при каждом словоупотреблении размечены имеющиеся в нем сочетания согласных и гласных букв, которые могут представлять интерес для исследований, касающихся норм произношения сочетаний звуков. Если нужно найти сочетание двух или трех конкретных гласных внутри слова, их следует набрать в строке «Орфоэпическая структура», а потом щелкнуть по кнопке «Искать»:

Аналогичным образом ищутся сочетания согласных (например, стр) или гласных и согласных (например, сча). При этом, однако, мы не можем искать более трех единиц (например, сочетание стро найти уже нельзя).

Возможен поиск сочетаний групп согласных и гласных. Например, чтобы найти сочетание «губной согласный + заднеязычный согласный + гласный переднего ряда», следует щелкнуть по ссылке «Выбрать» в строке «Орфоэпическая структура». Откроется диалоговое окно, в котором нужно выбрать последовательно соответствующие позиции, щелкнуть по кнопке OK, а потом – по кнопке «Искать»:

Пользователь также может использовать квадратные скобки для выбора соответствующего звукосочетания. Так, запись структуры [мн]а[мн] означает, что будут найдены словоформы с буквосочетаниями ман, мам, нам, нан. Для того, чтобы найти сочетание букв на границе слов, для обозначения границы используйте знак подчеркивания:

Этот же знак используется для обозначения границы слова между группами звуков. Например, запрос на сочетание заднеязычных согласных на границе слова выглядит следующим образом:

В случае, если вам нужно найти сочетание конечных гласных перед любым началом слова, используйте запрос следующей структуры:

или

Поиск по вокалической структуре слова

Поскольку в МУРКО размещены тексты с размеченными реальными ударениями, это дает возможность пользователю найти слова с одинаковым акцентным контуром, вне зависимости от их морфологических и семантических характеристик. А именно, при поиске словоформ одинаковой вокалической структуры можно учитывать: 1) количество слогов, 2) качество и номер ударного слога, 3) качество и номер предударного слога, 4) качество и номер заударного слога. Для этого в строке «Вокалическая структура» следует щелкнуть по кнопке «выбрать» и в открывшемся диалоговом окне выбрать нужные вам параметры. Например, в следующем примере формируется поиск словоформ с третьим по счету ударным слогом и первой предударной гласной о:

После нажатия кнопки OK в диалоговом окне строка поиска выглядит следующим образом:

То есть 1) ударный слог имеет номер 3 при счете от начала словоформы, 2) в словоформе первая предударная гласная (т.е. первая при счете налево от ударного слога) – о, 3) качество и количество заударных гласных и общее число слогов не заданы. В качестве ответа на данный запрос вы получите кликсты, в которых будут словоформы георгины, потому, хорошо, заодно, стороне, гастроном, разворачивается и мн. др.

В случае, если вам нужны все предударные гласные словоформы, и первая, и вторая, прямо в строке поиска вы должны дописать то, что вам нужно:

Такой запрос обозначает, что вы хотите найти то же самое, что и в предыдущем запросе, но только второй предударный гласный в искомых словоформах должен быть а. В ответе на такой запрос встретятся словоформы заодно, разворачивается, Краснореченск, нахожу и др.

Как найти то или иное речевое действие?

В небольшой части МУРКО (т.н. «глубоко аннотированный» МУРКО) размечены разные типы речевых действий и жестов. Для их поиска на сайте предусмотрен специальный интерфейс, который ввиду своего большого объема по умолчанию свернут и выглядит следующим образом:

Для того, чтобы задать поиск по тем или иным типам речевых действий, следует щелкнуть по ссылке «задать» и начать работу с открывшимся списком:

Первые четыре позиции характеризуют ситуацию, отраженную в кликсте, с социологической точки зрения (количество участников, их пол, язык, который звучит в кликсте, и отраженная в нем социальная ситуация).

Если вы хотите вести поиск по всем файлам, то в социологической зоне разметки не задавайте никаких ограничений.

Следующая зона разметки речевых действий содержит порядка 150 разновидностей разных речевых актов, организованных в 13 групп. Чтобы знать, какие именно речевые акты размечены в корпусе и в какой именно группе они размещены, обратитесь к справочному списку, щелкнув по вопросительному знаку в первой строке поискового интерфейса:

В открывшемся окне полужирным шрифтом даны те речевые акты, которые вообще размечаются в корпусе, а светлым шрифтом в скобках — названия групп, в которых они размещены (так, зов следует искать в апеллятивах, запрет — в отрицаниях, а заявление — в утверждениях).

Щелкнув на закладке любого названия группы речевых актов, например, «Чужая речь», вы получите диалоговое окно со списком соответствующих речевых актов. Нажав в нем на кнопку «Инвертировать», вы сможете искать все случаи чужой речи, без ее разделения на отдельные типы:

Отдельно пользователь имеет возможность выбрать кликсты с высказываниями разной степени полноты (параметр «Полнота речевого действия»), включающие разные типы повторов (параметр «Наличие и типы повторов»), разную манеру говорения, а также разнообразные вокальные жесты и междометия («Манера говорения», «Типы вокальных жестов и междометий»). Пользователю следует выбрать интересующий его параметр и в соответствующем окне поставить галочку напротив того или иного значения параметра:

Выбрав нужное вам значение параметра и щелкнув по кнопке OK, перейдите к кнопке «Искать» на основной странице поиска и щелкните по ней:

Как найти тот или иной жест?

В небольшой части МУРКО размечены разные типы речевых действий и жестов. Для их поиска на сайте предусмотрен специальный интерфейс, который ввиду своего большого объема по умолчанию свернут и выглядит следующим образом:

Для того, чтобы задать поиск по тем или иным жестам, следует щелкнуть по ссылке «задать» и начать работу с открывшимся списком:

Выбрав нужное вам значение параметра и щелкнув по кнопке OK, перейдите к кнопке «Искать» на основной странице поиска и щелкните по ней:

Социологические характеристики жеста

Параметр «Имя говорящего (актера)» предоставляет пользователю возможность работать только с теми кликстами, где жестикулирует тот или иной актер из предложенного списка:

Пол говорящего (актера), естественно, может быть мужским или женским, но в особых случаях, например, когда жестикулирующий не виден целиком и неясен из ситуации, пол может отмечаться как неизвестный:

Пол персонажа имеет более сложную структуру, чем пол говорящего: отмечаются случаи, когда реальный пол актера и пол персонажа не совпадают:

Возраст актера и персонажа определяются описательно (ребенок, подросток, взрослый, пожилой):

Напомним, что точный возраст говорящего (если он известен) можно задать, формируя подкорпус с использованием социологических характеристик (см. п. 1 Как задать свой подкорпус?), кроме того, возраст говорящего и год его рождения указаны в корпусе при каждой реплике.

Объективные характеристики жеста

1. Пользователь может задать основной орган, который формирует искомый жест (например, отобрать кликсты/клипы, которые содержат жесты головы), а может выбрать конкретный активный орган, имеющий отношение к данному основному органу (например, отобрать кликсты/клипы, которые содержат жесты, осуществляемые указательным пальцем). Для того, чтобы определить, какие именно основные и активные органы размечены в корпусе, следует щелкнуть либо по закладке «Основной орган», либо по закладке «Активный орган»:

Выбрав необходимый орган, следует щелкнуть по кнопке OK. Естественно, одновременно можно выбрать несколько активных органов. Вы также можете выбрать любой пассивный орган

или адаптор:

2. Объективная характеристика жеста включает в себя его временные и пространственные характеристики.

Временные характеристики описывают жест с точки зрения его однократности или многократности:

При этом следует учитывать, что в корпусе при назывании многократных жестов используется несовершенный вид, а при назывании однократных жестов — совершенный вид (кивать vs. кивнуть).

Пространственная характеристика всех жестов включает в себя указание на направление движения активного органа. При этом для всех направлений движения указаны актуальные для данного направления активные органы:

Специально для жестов рук добавлены такие пространственные характеристики, как ориентация ладони (ладоней) и кисти (кистей):

При этом, как видно, ориентация кисти (кистей) в значительной степени определяется ориентацией ладони (ладоней), соответственно, ориентация кисти (кистей) выбирается в соответствии с выбором ориентации ладони (ладоней).

3. И, наконец, объективная характеристика жеста включает указание на используемые в ходе жестикуляции предметы и их роль в осуществлении жеста. Следовательно, пользователь может выбрать удлинители, спойлеры и аксессуары, участвующие в искомом жесте:

Субъективные характеристики жеста

Жесты в корпусе с субъективной (функционально-прагматической) точки зрения описываются как триады тип жеста / значение жеста / название жеста. На данный момент определено 14 типов жестов, выделенных в соответствии с функцией и происхождением жестов (последнее верно для заимствованных жестов, которые — в случае, если бы они не были заимствованы, — распределились бы по остальным 13-ти группам).

Для того, чтобы узнать, какие именно жесты встречаются в корпусе, следует щелкнуть по вопросительному знаку в строке «Жесты»:

После этого откроется справочное окно, в котором значения жестов даны полужирным шрифтом и расположены в алфавитном порядке; после значения жестов в скобках обозначен тип жестов, к которому относится данное значение, а затем курсивом перечислены все жесты, встретившиеся в корпусе в этом значении.

В случае, если вы хотите выбрать для анализа все жесты данного типа или только отдельные значения, следует щелкнуть на закладке «Тип жеста» или «Значение жеста»:

В случае, если вы хотите выбрать кликсты/клипы с жестами, имеющими в русском языке одно и то же название, вы должны щелкнуть на закладке «Название жеста»:

Открывшееся диалоговое окно позволит вам при необходимости уточнить, в каком именно значении вы хотите исследовать данный жест (например, для жеста отмахнуться вы можете выбрать значение жеста внутреннего состояния пренебрежение или этикетного жеста не стоит благодарности).

Дополнительные характеристики жеста

Вы можете определить, какие проявления эмоций сопровождают выбранный вами жест. Для этого следует щелкнуть на закладке «Эмоции» и в открывшемся диалоговом окне выбрать значение этого параметра из предлагаемого списка:

Жест также может быть охарактеризован с точки зрения полноты его осуществления. Для того, чтобы выбрать необходимое значение параметра, следует щелкнуть на закладке «Полнота жеста» и выбрать нужное значение в открывшемся диалоговом окне:

И, наконец, жест описывается с точки зрения его аутентичности. Для этого следует щелкнуть на закладке «Аутентичность жеста» и выбрать то или иное значение в диалоговом окне:

Интерфейс выдачи

На любой ваш запрос открывается специальное окно выдачи, которое имеет следующую структуру:

  1. Для того, чтобы запустить ролик, нужно щелкнуть по большой желтой стрелке в центре ролика.

  2. Для того, чтобы повысить качество видео, следует щелкнуть по кнопке «Качество» (левый верхний угол ролика, обведено белым и черным кругом).

  3. Для того, чтобы скачать ролик на свой компьютер, следует щелкнуть закладку «Скачать mp4» в правом верхнем углу ролика (обведено белым и черным кругом).

  4. В левом нижнем углу ролика (красный треугольник) дается информация о его длительности.

  5. Нижняя строка ролика (желтый прямоугольник) отведена для уникального имени ролика в базе данных корпуса.

  6. Зеленая стрелка указывает на таблицу жестов, которые размечены для данного кликста/клипа (если, конечно, данный клип был размечен с точки зрения жестикуляции); таблица содержит имя жестикулирующего актера (если оно известно), его пол (это важно для тех актеров, имя которые неизвестно, и облегчает ориентацию в клипе), активный орган, название и значение жеста. Таблица призвана помочь пользователю понять, какие именно жесты отмечены в данном клипе и как именно они были проинтерпретированы.

  7. Оранжевым пятиугольником обозначена закладка (многоточие), щелкнув по которой, вы получаете возможность работать только с данным конкретным кликстом, а также указать его точный адрес в интернете:

Щелкнув по ссылке «Предыдущий фрагмент» или «Следующий фрагмент», можно просмотреть клип, непосредственно предшествующий найденному или следующий за ним:



Национальный корпус русского языка
© 2003–2017
info@ruscorpora.ru