Кореферентная разметка

Кореферентная разметка доступна только в Синтаксическом корпусе (СинТагРус).

Кореферентные связи устанавливаются между именными группами, которые отсылают к одному и тому же объекту или ситуации. Подмножеством кореферентных связей являются анафорические связи, направленные от местоимений к их антецедентам. В Синтаксическом корпусе кореферентные связи соединяют словоформы — вершины именных групп или некоторых других составляющих и не содержат информации об их границах.

В данной версии корпуса система поиска позволяет находить не все имеющиеся в текстах кореферентные связи, а только те, которые находятся в пределах одного предложения. В следующих версиях корпуса можно будет находить цепочки кореферентных связей в пределах всего текста.

В настоящее время кореферентная разметка доступна в 25 текстах Синтаксического корпуса. Поиск кореферентных связей доступен для 5 460 предложений.

Анафорические и катафорические связи от местоимений проводятся к их ближайшим неместоименным антецедентам, а кореферентные связи от неместоименных слов — к ближайшим неместоименным упоминаниям той же сущности. Если антецедент является сочиненным или расщепленным, то от местоимения / неместоименного существительного проводятся связи к каждому из его элементов.

В корпусе размечаются следующие виды связей:

1. анафорические связи, направленные справа налево:

  • от возвратных (себя, свой) и взаимно-возвратных (друг друга / друг дружку) местоимений — в любых случаях, включая связанную анафору с кванторными антецедентами (никто из них, даже кляня свою судьбу, не променял бы ее ни на чью другую);
  • от местоимений 3-го лица, включая «местоимение переключения референции» тот (Он ястребом взглянул на Илью Ильича, и тот, поняв, немедленно исчез, как дым);
  • от всех видов относительных местоимений, включая наречные (который, кто, что, чей, какой, где, куда, откуда, когда);
  • от местоимений-наречий здесь, тут, там, туда, оттуда, тогда. Если их антецедентом является не существительное или наречие, а предложная группа, то кореферентная связь проводится к предлогу: в доме / у дома / за домомтам (Когда мы подъехали к переправе, то увидели скопление воинских частей у моста и некоторую неразбериху, царящую там);
  • от местоимения это, если у него есть именной антецедент (…Лева вроде бы и приблизился к своей детской мечте о науке, но тут же ему стало не до этого).

2. катафорические связи, направленные слева направо:

  • от возвратных и взаимно-возвратных местоимений (Своими впечатлениями о совещании я попросил поделиться профессора МГУ В.Петрова);
  • от местоимений 3-го лица (Вредные они все-таки, преподаватели!);

3. кореферентные связи, направленные справа налево:

  • между неместоименными существительными, а также прилагательными и причастиями, которые выполняют функции существительных или остаются после эллипсиса существительного — вершины именной группы. Существительные могут быть предметными, событийными или обозначениями отрезков времени и иметь любой референциальный статус, кроме предикативного, при котором именная группа не отсылает ни к какой сущности или классу сущностей (Лева… с детства мечтал стать ученым). В частности, в корпусе проводятся кореферентные связи между родовыми именными группами, отсылающими к одному и тому же классу (Поэтому переход к плазме содержит еще ряд промежуточных этапов, и цепочку лучше изобразить так: «твердое тело — жидкость — пар — газ — слабоионизированный газ — плазма».);
  • между существительными и притяжательными прилагательными или некоторыми видами относительных прилагательных (ЛюдаЛюдин; Сибирьсибирский);
  • между местоимениями 1-го и 2-го лица и другими упоминаниями (Тогда Ищенко закричал: — Ты что, проверяешь меня?).

Разметка кореферентных связей в СинТагРусе проводится в полуавтоматическом режиме: для каждого предложения сначала запускаются правила разрешения анафоры и кореферентности в системе ЭТАП, а если они устанавливают неправильные связи, разметчик исправляет их вручную.

Обновлено