Корпус
  • 1249 текстов
  • 23 932 слова
исторический, параллельный, омонимия снята
Корпус: Исторические | Берестяные грамоты
Корпус берестяных грамот

Состав и разметка корпуса

В корпус входят тексты берестяных грамот с восточнославянской территории, а также двух свинцовых грамот, найденных в Великом Новгороде.

Корпус представляет собой максимально полный и актуальный свод лингвистической информации о тексте всех известных науке берестяных грамот, доступной на момент последней регулярной публикации статьи о находках берестяных грамот в журнале «Вопросы языкознания». Корпус полностью синхронизирован с базой данных «Древнерусские берестяные грамоты», оба ресурса пополняются и обновляются ежегодно.

Корпус снабжен пословной морфологической разметкой, основанной на указателе к книге А. А. Зализняка «Древненовгородский диалект» (издание 2004 г.), который был программно обращен на словоформы в текстах грамот, вошедших в эту книгу. Далее результаты автоматической разметки был скорректированы и пополнены, а не вошедшие в книгу А. А. Зализняка тексты, в том числе найденные после 2003 года грамоты, были размечены по этому образцу вручную.

Хронологический диапазон корпуса берестяных грамот — XI—XV века, иными словами, он пересекается и с периодом древнерусского языка (XI—XIV века), и со старорусским (XV век, к которому относится меньшинство грамот). Это обстоятельство вместе с отдельным стандартом морфологической разметки продиктовали оформление берестяных грамот в отдельный исторический корпус. Леммы, вслед за указателями А. А. Зализняка, отражают падение и прояснение редуцированных (слати, день). 

В метаразметке корпуса указана, помимо условной даты написания грамоты, также жанр и тип текста, сохранность грамоты, город находки, стратиграфическая дата, археологический раскоп и том издания «Новгородские грамоты на бересте». По этим параметрам можно отобрать подкорпус. При помощи гиперссылки метаразметка каждой грамоты связана с её страницей в базе данных «Древнерусские берестяные грамоты».

С 2021 г. корпус берестяных грамот стал параллельным: к текстам, доступным в переводах А. А. Зализняка и продолжающих их переводах А. А. Гиппиуса, добавлены русские переводы, а кроме того, сделаны доступными английские переводы Р. Ковалева и Й. Схакена, охватывающие в совокупности 337 грамот (57 из них существует в двух английских версиях). Разметка и поиск по корпусу устроены аналогично поиску в корпусе параллельных текстов. Параллелизация корпуса берестяных грамот позволяет найти древнерусские соответствия английских и русских лексем и конструкций (и наоборот), а также вести поиск древнерусской лексики по семантическим полям.

Программная реализация автоматической разметки текстов из книги «Древненовгородский диалект» принадлежит Т. А. Архангельскому.  Ручная разметка корпуса велась в рабочем месте «Морфи» (автор Т. А. Архангельский) Е. А. Мишиной, затем также Д. В. Сичинавой. Синхронизацию корпуса с базой данных и развитие корпуса как параллельного реализовали А. Н. Дышкант и Д. В. Сичинава.

Публикации

Ознакомьтесь со списком научных публикаций о корпусе берестяных грамот по ссылке: https://ruscorpora.ru/s/az5o2. В разделе «‎Публикации»‎ используйте фильтры, чтобы найти другие типы публикаций о корпусе.

Обновлено 22.07.2024