Национальный корпус русского языка — представительная коллекция текстов
на русском языке
общим объемом более 2 млрд слов,
оснащенная лингвистической разметкой и инструментами поиска
Поиск по корпусам
Новости
В исторических корпусах «Берестяные грамоты» и «Эпиграфика» появились фотографии и прориси исходных грамот и надписей.
По умолчанию в конкордансе видны изображения в формате превью: слева расположены фотографии, а справа — прориси. Щелчок по картинке открывает ее в полноэкранном режиме, где можно увеличивать или уменьшать рисунки и фотографии, а также скачивать их.
В режиме KWIC и при выборе подкорпуса изображения можно увидеть только в полноэкранном режиме, щелкнув по иконке справа от заголовка текста.
Для скрытия изображений предусмотрена соответствующая настройка. Эта опция сохраняется в браузере пользователя: при следующем обращении к корпусу настройки сохранятся и выдача будет отображаться без картинок.
Новый функционал реализован благодаря сотрудничеству с командами разработчиков сайтов gramoty.ru и epigrafika.ru. На этих платформах представлена более подробная информация о грамотах и надписях. Мы выражаем благодарность нашим коллегам и надеемся на дальнейшее успешное сотрудничество.
Корпус «Русская классика» пополнен академическими полными собраниями сочинений Александра Сергеевича Грибоедова и Федора Ивановича Тютчева. Наследие этих писателей сравнительно невелико по объему (причем по-русски Тютчев написал даже меньше, чем «автор одной книги» Грибоедов), однако их язык представляет большой интерес с различных точек зрения. В корпус входят варианты, представленные в разных редакциях текстов. Все тексты корпуса заново размечены с учетом улучшений в языковой модели Рубик.
В Церковнославянский корпус включены новые тексты общим объемом 100 тысяч слов. Это небольшая часть свода житий святых, составленного известным церковным деятелем Димитрием Ростовским (Туптало) в начале XVIII в. Новое пополнение существенно увеличило объем нарративных текстов, ранее фактически представленных лишь Библией.
Корпус переведен в орфографию, приближенную к принятой в печатных новоцерковнославянских книгах. При этом для удобства пользователя доступен полноценный поиск и в упрощенной орфографии, в том числе и с помощью всплывающего словаря лемм.
В Церковнославянском корпусе, объемном и лексически богатом, доступен сервис «Похожие слова», дающий наглядное представление о семантических полях славянской лексики.
В корпусе доступен режим «Частотность», позволяющий анализировать сочетаемость лексем и грамматических показателей. Обратите внимание, что грамматическая омонимия пока снята лишь в ограниченной степени.
В последний рабочий день уходящего года по традиции команда Национального корпуса русского языка подводит итоги и вспоминает, что нового произошло за год.
В 2024 году Корпус увеличился более чем на 109 миллионов слов. Во многих корпусах появились поисковые и статистические инструменты, доступные ранее только в Основном, Газетном и других «передовых» корпусах.
Мы надеемся, что на этой картинке каждый найдет для себя инструменты, которые сделают работу с Корпусом ещё более продуктивной и приятной. Пусть Новый год принесёт вам множество интересных открытий и вдохновляющих находок!
Отдельную благодарность мы выражаем создателям Корпуса чувашского языка, Открытого корпуса вепсского и карельского языков (ВепКар), Электронного корпуса хакасского языка за плодотворное сотрудничество.
С самыми тёплыми пожеланиями в Новом году,
Команда Национального корпуса русского языка