Национальный корпус русского языка — представительная коллекция текстов
на русском языке
общим объемом более 2 млрд слов,
оснащенная лингвистической разметкой и инструментами поиска
Поиск по корпусам
Новости
В сервисе «Портрет слова» в основном корпусе для каждого слова визуализируется морфемный состав: при помощи знаков, принятых в школьном преподавании русского языка, выделены приставки, корни, суффиксы и окончания. В основе разметки словообразовательной структуры лежит специально разработанный для корпуса словарь морфемного анализа, а для лемм, отсутствующих в словаре, разборы сгенерированы нейросетевым алгоритмом НейроКРЯ. Обратите внимание, что членение слов на морфемы может отличаться от привычного вам (см. «Принципы разметки»).
При морфемном членении несловарных слов возможны ошибки. При обнаружении несоответствия принципам разметки, сообщайте об ошибке при помощи кнопки «Оценить».
Существенно обновлен интерфейс параллельного многоязычного корпуса. Для него доступны сервисы «Обзор возможностей» и «Портрет слова». Теперь все параллельные корпуса отображаются в новом интерфейсе.
Продолжаем обновлять Портрет слова: теперь можно увидеть Барометр частотности в Древнерусском корпусе.
Поэтический корпус пополнен на 400 тысяч словоупотреблений. В частности, добавлены новые тексты поэтов XX века, а также большая коллекция русских переводов античной поэзии: «Илиада» Гомера в переводе Н. И. Гнедича, «Энеида» Вергилия в переводе В. Я. Брюсова и С. М. Соловьева и сатиры Горация в переводе А. А. Фета.
Все параллельные двуязычные корпуса теперь работают в новом интерфейсе.
Существенно обновлен интерфейс древнерусского корпуса, корпус подключен к обзору возможностей. Отбор подкорпуса в древнерусском корпусе теперь находится на отдельной странице, как во всех корпусах в новом интерфейсе. В поле «Название памятника» можно выбрать из списка один или несколько памятников, в которых будет вестись поиск.
В коллокациях появилась возможность задавать синтаксические связи. Например, если задать ключ решение, а для коллоката указать часть речи «глагол», синтаксическую связь «дополнение», направление связи — «управляет», можно найти, что чаще всего делают с решением (принимают, согласовывают и т.д.). В таблице с результатами поиска будет показано 100 самых частотных коллокаций с такой синтаксической связью. Для каждой из этих коллокаций можно увидеть примеры, перейдя по ссылке.
У пользователей основного корпуса появилась возможность получить частотный словарь основных частей речи: существительных, прилагательных, глаголов и наречий. Такой же выбор появился и в частотном словаре подкорпуса - теперь при сравнении наиболее частотных лемм отобранного вами подкорпуса и корпуса можно указать часть речи.
Мы начали переводить параллельные корпуса на новый интерфейс. В конце апреля новый дизайн получили корпуса:
В форме поиска каждого из этих корпусов можно выбрать поиск точных форм, лексико-грамматический поиск или поиск на двух языках. Важное нововведение - в новом интерфейсе поиск на двух языках располагается не на отдельной, а на основной странице поиска. Запросы на русском и иностранном языке вводятся в двух разных группах условий на слова. Формат выдачи примеров в две колонки уже знаком тем, кто работает с корпусом берестяных грамот. Слева вы увидите оригинал, а справа - все доступные переводы.
В этом году НКРЯ активно сотрудничал с «Тотальным диктантом» — ежегодным просветительским мероприятием, объединяющим людей, которые владеют русским языком и стремятся писать грамотно. Каждое из группы слов #12словтотального сопровождалось ссылкой на наш портрет слова.
В день проведения диктанта В.А. Плунгян поделился мыслями о том, зачем Корпус нужен лингвистам и нелингвистам, как Корпус меняется и какие годы были наиболее продуктивными в истории НКРЯ. Посмотрите запись беседы, это познавательно и увлекательно.