Новости НКРЯ

Объём газетного корпуса вырос почти вдвое и достиг 765 миллионов словоупотреблений. Временной охват корпуса теперь начинается с 1983 г. (газета «Аргументы и факты») и доходит до 2021 г.
В поиске доступна обновлённая версия старорусского корпуса. Впервые в разметку добавлены леммы для большинства словоформ, тем самым корпус получил полноценную морфологическую разметку (полуавтоматическую, на базе нейросетевых алгоритмов). Леммы основаны на позднедревнерусском стандарте, принятом в Словаре русского языка XI—XVII веков. Кроме того, корпус пополнен текстами из Архива стольника Безобразова — важного источника по истории русского делового и разговорного языка XVII в. Объём всего корпуса — 8,5 млн словоупотреблений.
В устном и газетном корпусах в меню дополнительных признаков появился поиск слов в составе неоднословных лексических сочетаний.

Показать все