Новости НКРЯ
Задействован поиск повтора предыдущей лексемы или грамматической характеристики (в поле «дополнительные признаки»). Размещены инструкции пользователя в формате PDF к основному и обучающему корпусам.
Пополнение корпуса со снятой омонимией, объём которого составил около 6 млн словоупотреблений. Добавлены тексты XVIII — 1-й половины XX века, современные нехудожественные тексты (публицистика, специальные тексты, материалы электронной коммуникации)
Пополнение корпуса с неснятой омонимией на 16 млн словоупотреблений. Включены тексты первой половины XX в. (включая также большой массив нехудожественных: мемуары, официальные документы), драматические произведения различных периодов, публицистические и художественные тексты 1960-1980-х гг.
Пополнение поэтического корпуса — включены тексты авторов XVIII—XIX вв. (от Кантемира до Огарёва) и трёх авторов XX в. (Бунин, Анненский, Мандельштам); всего около 1 млн словоупотреблений. Появилась возможность поиска по дополнительным параметрам (частные особенности метрики, строфики, рифмы).
Пополнение диалектного корпуса — общий объём корпуса составляет 150 тысяч словоупотреблений. Значительно расширилась тематика и география представленных текстов.
На сайте размещён обучающий корпус — предназначенный для образовательных целей корпус с дополнительными грамматическими параметрами, предусмотренными школьной программой (типы склонений, разряды местоимений и др.).
Добавлена возможность регулировать настройки выдачи поиска (количество документов или контекстов на странице, сортировка).
Национальный корпус русского языка участвует в выставке «Инновационные достижения России» в рамках XI Петербургского международного экономического форума.
Масштабное обновление Корпуса:
- 1. Открытие двух новых составляющих корпусов: корпуса поэтических текстов (ряд авторов первой половины XIX в.), снабжённого, помимо обычной морфологической и семантической, разметкой параметров стиха -- рифмы, строфики, метрики, -- и корпуса диалектных текстов, снабжённого лингвистической разметкой специфических диалектных форм.
- 2. Открытие в составе главного корпуса особого подкорпуса живой русской речи: расширение массива устных публичных и непубличных текстов. добавления текстов мультимедиа (кинофильмов).
- 3. Пополнение основного корпуса со снятой грамматической омонимией, в основном записями устной речи и текстами XVIII — первой половины XX в.
- 4. Пополнение основного корпуса с неснятой грамматической омонимией: художественная литература, научные журналы, тексты 1750-1950 гг.
Расширен поиск по лексико-семантическим признакам. Теперь можно искать имена собственные: ФИО, топонимы и названия учреждений.
Пополнение корпуса с неснятой омонимией (до объёма 120 млн словоупотреблений): добавлены научные тексты, художественные произведения, тексты XIX века (разных жанров), советская пресса середины XX века, записи устной речи (публичных выступлений и непубличных микродиалогов).
Доступен поиск по подкорпусу устной речи.
Доступна лексико-семантическая разметка на корпусе с неснятой омонимией.