Новости НКРЯ

В 2009 году вышли два сборника, в которых принимал непосредственное участие коллектив разработчиков Корпуса:

  1. Национальный корпус русского языка: 2006—2008. Новые результаты и перспективы. — СПб.: Нестор-История, 2009. — 502 с.
  2. Корпусные исследования по русской грамматике. — М., Пробел, 2009. — 516 с.

Национальный корпус русского языка стал обладателем специального приза конкурса работников электронных средств массовой информации «За образцовое владение русским языком в профессиональной деятельности»

Выложена новая версия глубоко аннотированного корпуса русских текстов СинТагРус. По сравнению с предыдущей версией в корпус было добавлено 88 современных статей научно-популярной, экономической и общественно-политической тематики, опубликованных в российской периодической печати в 2007-2008 гг. Попутно были исправлены замеченные ошибки. В настоящий момент СинТагРус содержит 41187 аннотированных предложений.

 

На сайте Института русского языка РАН размещены словари, созданные на основе Национального корпуса русского языка: грамматический словарь новых слов русского языка, новый частотный словарь русской лексики, словарь сочетаемости слов со значением высокой степени, словарь глагольной сочетаемости непредметных имён русского языка.

Пополнение поэтического корпуса (добавлены тексты ряда авторов XVIII – XIX в., включая сборники второстепенных поэтов 1790–1830-х годов «Библиотеки поэта»). Доступен список авторов поэтического корпуса с возможностью перехода на подкорпуса текстов каждого из них.

 

В основном корпусе доступны опции поиска слов в составе идиоматических оборотов и вне оборотов. Доступен также расширенный семантический поиск по первому/не первому значению слова, а также в части контекстов, где разрешена лексико-семантическая омонимия.

Пополнение параллельного корпуса; добавлен немецко-русский корпус (доступен для лексико-грамматического поиска в общей форме параллельных корпусов).

 

Пополнение корпусов. Расширены устный корпус (объём достиг 7,8 млн слов), акцентологический корпус (объём достиг 4,45 млн слов).

Пополнение корпусов. Расширены основной корпус (тексты первой половины XX в. — объём достиг 40 млн слов, тексты XVIII в. — объём достиг 2,6 млн слов), поэтический корпус (объём достиг 3 млн слов).