Новости НКРЯ

Объём латышско-русского и русско-латышского параллельного корпуса вырос более чем втрое и достиг 2,5 млн словоупотреблений. Объём бурятско-русско и русско-бурятского параллельного корпуса вырос более чем вдвое и достиг 270 тыс. словоупотреблений.

Пополнение параллельных корпусов, совокупный объём которых достиг 76,8 млн словоупотреблений.
Открыт новый параллельный шведско-русский корпус объёмом 400 тысяч словоупотреблений с морфологической разметкой.
Испанско-русский корпус преодолел пилотную стадию, вырос более чем вчетверо и насчитывает 1,3 млн словоупотреблений. В него включены тексты современных испаноязычных СМИ в русском переводе, а также художественная литература XIX—XX веков.
Существенно вырос объём и китайско-русского параллельного корпуса, насчитывающего теперь 180 тысяч слов.
Пополнились также французский (до 3,9 млн), белорусский (до 9,4 млн), бурятский (до 120 тысяч) и другие параллельные корпуса.

Появилась возможность задать в поэтическом корпусе подкорпус по месту написания стихотворения, указанному в авторской помете, с помощью интерактивной карты.

Школа лингвистики НИУ ВШЭ и образовательный сайт «Верные слова» организуют онлайн-олимпиаду «Что может корпус». Олимпиада проходит с 20 марта по 20 апреля в трёх возрастных группах: дети 7—10 лет, 10—13 лет и 13—16 лет. Цель олимпиады — показать детям, родителям и учителям, какие сведения о языке и культуре они могут получить в Национальном корпусе русского языка и как эффективно работать с этим ресурсом дома и на уроках.

Пополнены акцентологический корпус (до 31,7 млн словоупотреблений) и устный корпус (до 12 млн).
Пополнение в составе мультимедийного корпуса (более 4,6 млн словоупотреблений) и Мультимедийного параллельного корпуса, который теперь включает в себя 6 постановок и 3 экранизации пьесы Н. В. Гоголя «Ревизор»

Пополнение основного корпуса. Объём корпуса вырос на 18 млн словоупотреблений и достиг 283 млн. Объём текстов в старой орфографии вырос вдвое (до 3,7 млн слов). В корпус вошли документы XVIII века, тексты первого русского научного журнала «Ежемесячные сочинения», мемуары XIX — XX в., дневники начала XX в., художественная литература разных периодов, современная детская, детективная, научная, философская проза и многие другие тексты. Впервые за долгое время пополнен корпус со снятой омонимией; в него включено 24 текста электронной коммуникации. Исправлена и унифицирована разметка корпуса на разных уровнях.

Вышел первый сборник материалов к «Корпусной грамматике русского языка» — синхронного описания русской грамматики, опирающегося на данные Корпуса (проект rusgram.ru). Материалы к корпусной грамматике русского языка. Глагол. Часть 1. СПб.: Нестор-История, 2016.
Авторы: Н. Р. Добрушина, А. Б. Летучий, Е. В. Падучева, С. С. Сай.
Ответственный редактор: В. А. Плунгян.
Научные редакторы: Е. В. Рахилина, Е. Р. Добрушина, Н. М. Стойнова.

Обновление диалектного корпуса, метатекстовая и грамматическая разметка которого значительно усовершенствованы. Совокупный объём корпуса достиг 285 тысяч словоупотреблений в 627 текстах из 22 регионов России. Для 15 текстов доступна аудиозапись (через паспорт текста), для 126 — неорфографизированная запись, для 431 — «глубокая» метатекстовая разметка с подробным указанием жанра, со сведениями об информанте и о фонетических особенностях говора.

В составе параллельного латышско-русского корпуса доступна латышская морфологическая разметка (с элементами семантики) и поиск по ней. Объём корпуса достиг 727 тыс. словоупотреблений.