Новости НКРЯ

Пополнение параллельного корпуса. Размер английского корпуса вырос с 20,2 до 24,6 млн словоупотреблений; он пополнен переводами русской классики и представительным собранием сочинений В. В. Набокова как русского, так и американского периода, в том числе в авторских переводах. Объём белорусского корпуса увеличился вдвое — с 3.4 до 6.8 млн словоупотреблений. Включены переводы русской и белорусской классики и приключенческой литературы.
Итальянский корпус преодолел пилотную стадию (0,7 млн) и насчитывает 4 млн словоупотреблений. Он включает художественные, философские и публицистические тексты разных периодов.
Открыт новый эстонский корпус объёмом 400 тыс. словоупотреблений (художественные тексты). Тексты снабжены морфологической разметкой. Пополнен также ряд других параллельных корпусов.
Для каждого двуязычного подкорпуса теперь доступна форма грамматического запроса, учитывающая специфику грамматических помет для соответствующего языка.

Пополнен старорусский корпус. Его объём вырос более чем вдвое — до 7 млн словоупотреблений. Добавлены новые тексты XIV–XVII веков: летописи, повести, деловые документы. Тексты доступны без морфологической разметки, при поиске слов и словосочетаний можно использовать символ *.

Пополнен древнерусский корпус. Для поиска доступно ещё три памятника: "Житие Андрея Юродивого", "Повесть об Акире Премудром" и "Вопрошание Кириково". Всего в корпусе теперь более полумиллиона слов. В древнерусском корпусе доступен поиск по семантической разметке многозначных слов и омонимов (возможно отдельно искать, например, миръ"вселенная" и миръ "покой").

Открыт подкорпус "Русская классика в немецких переводах", составленный при помощи Фонда поддержки Интернет. Объём подкорпуса 5 млн словоупотреблений, хронологический охват оригинальных текстов — от Пушкина до Горького, немецких переводов — от 1860-х до 1980-х годов.

Открыт пилотный вариант Мультимедийного параллельного корпуса (МультиПАРК), включающий в себя две театральные постановки и одну экранизацию пьесы Н.В. Гоголя "Ревизор".

Пополнены устный корпус (до 11,3 млн словоупотреблений) и мультимедийный корпус (до 4,3 млн).

В составе акцентологического корпуса существенно увеличена коллекция публичной речи, а также современных поэтических текстов. Кроме того, организован новый подкорпус «наивной поэзии». Объём акцентологического корпуса увеличен до 30 млн словоупотреблений.

Для общего доступа открыт корпус региональной и зарубежной прессы. Объём корпуса — более 13 млн словоупотреблений, в его составе представлены издания регионов России и ближнего зарубежья. В создании корпуса принимали участие преподаватели кафедры общего и славянского языкознания Гродненского государственного университета имени Янки Купалы (www.grsu.by).

Поэтический корпус пополнен на 0,6 млн словоупотреблений. В его состав включены произведения ряда поэтов Серебряного века и поэтов 1940-1970-х годов.

Пополнен поэтический корпус: общий объем составляет 10,3 млн словоупотреблений. В его состав включены произведения ряда поэтов Серебряного века и поэтов 1940-1960-х годов.