Национальный корпус русского языка — представительная коллекция текстов
на русском языке
общим объемом более 2 млрд слов,
оснащенная лингвистической разметкой и инструментами поиска
Поиск по корпусам
Новости
Для пользователей, которые только знакомятся с Корпусом, на главной странице доступен функционал «Обзор возможностей».
В октябре мы усовершенствовали его работу, добавив новые виджеты и сделав существующие виджеты более информативными. Теперь «Обзор возможностей» общий для всех корпусов НКРЯ.
Появился новый текстовый виджет, с помощью которого пользователь познакомится с основными терминами, используемыми в интерфейсе НКРЯ, узнает как приступить к поиску, какие бывают виды поиска и где можно подробнее о них прочитать.
Лексико-грамматический поиск, поиск точных форм и коллокаций теперь выдают результаты только из Основного корпуса.
В виджете «Случайное стихотворение» теперь видно не только само произведение, но и его название, автор и дата создания.
Названия корпусов в заголовках виджетов стали кликабельными – по ссылке пользователь перейдет в «Портрет корпуса», где сможет ознакомиться с его структурой и составом, узнать больше о создателях корпуса и прочитать публикации о нем.
В октябре были пополнены коллекции устной речи в Акцентологическом и Устном корпусах. Добавлены записи текстов устной профессиональной речи, монологов-воспоминаний, повседневной диалогической речи, записанной в разных регионах — Воронежской, Московской, Томской областях, Республике Бурятии, Марий Эл. За участие в сборе и подготовке текстов благодарим студентов и сотрудников Воронежского государственного университета, студентов МГУ им М.В. Ломоносова, Г.В. Коротких (АНО «Межэтническая ассоциация «Ильсат» («Душа»), г. Томск), Е.В. Кашкина (Группа по изучению контактного взаимодействия русского языка с языками коренных народов России, ИРЯ РАН).
Объем Устного корпуса теперь составляет 14,8 млн словоупотреблений, общий объем Акцентологического корпуса, вместе с наивной поэзией, — 135,5 млн словоупотреблений.
В обоих корпусах появилась возможность отбирать тексты по количеству словоформ. В форме отбора подкорпуса Устного корпуса регионы теперь сгруппированы по странам для удобства поиска.
В корпус «Восточнославянская эпиграфика» добавлено 86 разнообразных надписей – от XI до XV века, от Лукки, Вифлеема и Константинополя до Киева и Твери, от подписи на княжеском оружии до загадок и проклятий. Корпус достиг объема в 6 тысяч словоформ.
В корпусе появилась возможность отбирать тексты по количеству словоформ, а также задавать условия поиска только в переводах.
В Корпусе берестяных грамот появились 19 берестяных грамот из Новгорода и Старой Руссы, найденные в прошлом, 2023 году. Их объем — более 300 слов. Кроме того, внесены поправки в тексты и переводы ранее найденных берестяных грамот. В корпус попали такие новые слова, как ѣздець (‘ездок’), шида (‘шелк’), немочи (‘хворать’), крута (‘приданое’). Такие обычные слова, как огородъ, капуста, боꙗринъ тоже встретились впервые в новых грамотах.
Значительно улучшен поиск по корпусу, в форме запроса можно задавать новые пометы, связанные с грамматикой и интерпретацией слова.