Национальный корпус русского языка

Поиск по корпусам

Состав и структура

Статистика корпуса

Руководство пользователя

Портрет слова

Частотный словарь

НКРЯ в школе

19.11.2024

Русский МультиПАРК пополнен почти до 300 тыс. словоформ. Добавлена пьеса А.П. Чехова «‎Три сестры»‎ в постановках четырех разных театров: Государственного академического Малого театра, МХАТа им. М. Горького, Московского театра «Мастерская П. Фоменко», театра «Современник».

Русский МультиПАРК дает возможность сопоставительного изучения одной и той же реплики, произнесенной разными говорящими в одинаковых обстоятельствах. Сопоставление разных произнесений одной и той же фразы позволяет определить, какие интонационные, структурные, фонетические, жестовые особенности этой фразы являются обязательными, воспроизводимыми всеми говорящими, а какие — уникальными или случайными.

C материалами о составе корпуса и возможностях, которые он предоставляет, вы можете ознакомиться на сайте.

06.11.2024

Национальный корпус русского языка — это мощный инструмент для анализа и исследования языка. В нем собраны миллионы текстов, которые позволяют пользователям Корпуса лучше понять язык во всех его многообразных проявлениях. Один из важнейших аспектов работы с корпусом — анализ статистических данных.

Сводная статистика НКРЯ доступна с главной страницы сайта. В этом разделе содержится информация об объеме входящих в НКРЯ корпусов в текстах, предложениях и словоупотреблениях, а также таблицы с распределением текстов Основного корпуса по видам и другим метапризнакам.

Кликнув на название корпуса в таблице, вы можете перейти к статистике в Портрете выбранного корпуса. Перейти к статистике корпуса также можно из формы поиска по корпусу, кликнув на значок (i). Сейчас статистика корпуса доступна для Основного, Обучающего, Газетных корпусов, некоторых исторических корпусов, а также корпусов «‎Русская классика»‎ и «‎От 2 до 15».

В корпусах с расширенной статистикой также доступно сравнение пользовательского подкорпуса с целым корпусом. Для просмотра сравнительных данных нажмите на значок (i) в шапке подкорпуса.

06.11.2024

Параллельный корпус пополнен на 3 млн слов. Половина этого объема приходится на англоязычные нехудожественные (научно-популярные и публицистические) тексты. Кроме того, пополнены, в основном художественными произведениями, испанская и немецкая языковые пары.

В трех языковых парах, включающих записи устных текстов — вепсской, карельской и хакасской — доступен отбор подкорпуса по диалекту.

15.10.2024

Для пользователей, которые только знакомятся с Корпусом, на главной странице доступен функционал «Обзор возможностей».

В октябре мы усовершенствовали его работу, добавив новые виджеты и сделав существующие виджеты более информативными. Теперь «‎Обзор возможностей»‎ общий для всех корпусов НКРЯ.

Появился новый текстовый виджет, с помощью которого пользователь познакомится с основными терминами, используемыми в интерфейсе НКРЯ, узнает как приступить к поиску, какие бывают виды поиска и где можно подробнее о них прочитать.

Лексико-грамматический поиск, поиск точных форм и коллокаций теперь выдают результаты только из Основного корпуса.

В виджете «‎Случайное стихотворение»‎ теперь видно не только само произведение, но и его название, автор и дата создания.

Названия корпусов в заголовках виджетов стали кликабельными – по ссылке пользователь перейдет в «‎Портрет корпуса»‎, где сможет ознакомиться с его структурой и составом, узнать больше о создателях корпуса и прочитать публикации о нем.

Поиск по корпусам

Новости