Новости НКРЯ
На странице результатов поиска появилось несколько полезных инструментов:
- по ссылке «Посмотреть частотный словарь» можно перейти к списку самых частотных лемм и словоформ среди найденных документов;
- теперь можно сохранить результаты с текущей страницы выдачи в электронной таблице (Microsoft Excel, OpenOffice Calc);
- добавлена возможность случайного перемешивания результатов поиска (чтобы ее включить, перейдите в окно «Настройки» и выберите пункт «Сортировать случайно»).
Пополнение и усовершенствование функциональности Корпуса:
- — проведена унификация разметки в основном корпусе со снятой омонимией (вид и залог глагольной лексемы, формы причастий и деепричастий, ударение частотных словоформ имён собственных и несловарных слов, разбор имён собственных, сокращений, иностранных слов, ряд мелких исправлений);
- — пополнен основной корпус с неснятой омонимией: художественные и публицистические тексты XIX – первой половины XX века, мемуары второй половины XX века, научные тексты, научно-популярные и общественно-политические журналы 1950-1980-х годов, газеты 1990-х годов, тексты электронной коммуникации, официально-деловые тексты. Объём основного корпуса достиг 176 млн словоупотреблений.
- — пополнен корпус поэтических текстов: творчество поэтов XIX – начала XX в. (материалы выпусков «Библиотеки поэта»: «Поэты 1840-х гг.», «Поэты-петрашевцы», «Поэты 1860-х гг.», «Поэты 1880-1890-х гг.»; авторские сборники поэтов: И. Мятлев, М. Михайлов, Н. Щербина, П. Соловьева, А. Добролюбов, К. Бальмонт, Ю. Балтрушайтис, Е. Дмитриева (Черубина де Габриак), Л. Кобылинский (Эллис), А. Кондратьев, Б. Садовской, Т. Щепкина-Куперник, А. Скалдин, С. Соловьев, А. Тиняков, Вяч. Иванов, М. Волошин). Объём поэтического корпуса достиг 5 млн словоупотреблений.
- — пополнен корпус параллельных текстов, достигающий 9 млн словоупотреблений; добавлены англо-русские (Э. Бронте, Дж. Голсуорси, К. Льюис, К. Воннегут и др.) и немецко-русские (Новалис, Й. фон Эйхендорф, Г. Гессе, Г. Бёлль и др.) параллельные тексты. Впервые доступны для поиска украинско-русский и русско-украинский параллельные корпуса (500 тыс. словоупотреблений).
Доступна выдача в формате KWIC (key word in context) с выравниванием ключевых слов по центру. Чтобы включить этот режим, пройдите по ссылке «формат KWIC» или «настройки» в верхней части страницы выдачи.
Выложена новая версия глубоко аннотированного корпуса русских текстов СинТагРус.
Появилась форма для сообщения об ошибках в тексте. Чтобы сообщить об ошибке в разметке слова или документа, выделите его мышкой и во всплывающем окне нажмите «Сообщить об ошибке».
Также на странице с результатами поиска появились ссылки на поиск в других корпусах.
Доступен для поиска Корпус современной русской прессы (газеты и сообщения новостных интернет-агентств за период 2000—2008 гг) объёмом около 100 млн словоупотреблений. Тексты предоставлены компанией Corpus Technologies.
В 2009 году вышли два сборника, в которых принимал непосредственное участие коллектив разработчиков Корпуса:
- Национальный корпус русского языка: 2006—2008. Новые результаты и перспективы. — СПб.: Нестор-История, 2009. — 502 с.
- Корпусные исследования по русской грамматике. — М., Пробел, 2009. — 516 с.
Выложена новая версия глубоко аннотированного корпуса русских текстов СинТагРус. По сравнению с предыдущей версией в корпус было добавлено 88 современных статей научно-популярной, экономической и общественно-политической тематики, опубликованных в российской периодической печати в 2007-2008 гг. Попутно были исправлены замеченные ошибки. В настоящий момент СинТагРус содержит 41187 аннотированных предложений.
На сайте Института русского языка РАН размещены словари, созданные на основе Национального корпуса русского языка: грамматический словарь новых слов русского языка, новый частотный словарь русской лексики, словарь сочетаемости слов со значением высокой степени, словарь глагольной сочетаемости непредметных имён русского языка.
Национальный корпус русского языка стал обладателем специального приза конкурса работников электронных средств массовой информации «За образцовое владение русским языком в профессиональной деятельности»