Новости НКРЯ

Исторические корпуса пополнились древнерусским корпусом и корпусом берестяных грамот.

Часть корпуса со снятой омонимией объёмом около 1 млн словоупотреблений теперь доступна для оффлайн-использования.

Пополнение основного корпуса на 20 млн словоупотреблений (полный объём 230 млн словоупотреблений). Включены новые тексты различных периодов, включая художественную прозу и мемуары XVIII — начала XXI в., а также тексты СМИ и электронной коммуникации.

Открыт новый исторический корпус — корпус среднерусских текстов (XV — начало XVIII века). Объём корпуса — 3 млн словоупотреблений: литературные произведения, летописи, жития, деловые грамоты, бытовая переписка. Доступен поиск точных форм (без морфологической разметки), в том числе с использованием символа *, а также задание подкорпуса.

Обновление поэтического корпуса. Общий объём корпуса теперь составляет почти 8 млн словоупотреблений (50 тыс. документов).

Обновление параллельного корпуса. Общий объём составляет 42,8 млн словоупотреблений (вырос на 80%). Пополнены двуязычные английскийнемецкийукраинский и белорусский корпуса. Впервые доступны польскийфранцузскийитальянский и испанский корпуса. Возможен поиск внутри предложений на заданном языке (язык задаётся в поле «Дополнительные признаки»).

Существенно пополнился газетный корпус (большой корпус СМИ 2000-х годов). Теперь его объем превышает 332 тыс. документов, 173 млн словоупотреблений. Напоминаем, что ограничиться поиском по предыдущей версии корпуса можно в разделе «Версии» в форме выбора подкорпуса.

Произошло очередное пополнение мультимедийного и устного корпусов.

Год назад был запущен сервис «Графики», аналогичный сервису Google Books Ngram Viewer: распределение найденных по точной форме слов и словосочетаний по годам. Теперь такой график можно построить по результатам произвольного запроса к основному корпусу (а не только по точным формам, как раньше). Для этого перейдите по ссылке «Распределение по годам» на странице с результатами поиска и дождитесь ответа. Кроме того, по соседней ссылке «Статистика» доступны таблицы с распределением найденных документам по авторам, жанрам, типам, тематике текста и т. д.