Новости НКРЯ
Выложена новая версия глубоко аннотированного корпуса русских текстов СинТагРус.
Появилась форма для сообщения об ошибках в тексте. Чтобы сообщить об ошибке в разметке слова или документа, выделите его мышкой и во всплывающем окне нажмите «Сообщить об ошибке».
Также на странице с результатами поиска появились ссылки на поиск в других корпусах.
Доступен для поиска Корпус современной русской прессы (газеты и сообщения новостных интернет-агентств за период 2000—2008 гг) объёмом около 100 млн словоупотреблений. Тексты предоставлены компанией Corpus Technologies.
В 2009 году вышли два сборника, в которых принимал непосредственное участие коллектив разработчиков Корпуса:
- Национальный корпус русского языка: 2006—2008. Новые результаты и перспективы. — СПб.: Нестор-История, 2009. — 502 с.
- Корпусные исследования по русской грамматике. — М., Пробел, 2009. — 516 с.
Национальный корпус русского языка стал обладателем специального приза конкурса работников электронных средств массовой информации «За образцовое владение русским языком в профессиональной деятельности»
На сайте Института русского языка РАН размещены словари, созданные на основе Национального корпуса русского языка: грамматический словарь новых слов русского языка, новый частотный словарь русской лексики, словарь сочетаемости слов со значением высокой степени, словарь глагольной сочетаемости непредметных имён русского языка.
Выложена новая версия глубоко аннотированного корпуса русских текстов СинТагРус. По сравнению с предыдущей версией в корпус было добавлено 88 современных статей научно-популярной, экономической и общественно-политической тематики, опубликованных в российской периодической печати в 2007-2008 гг. Попутно были исправлены замеченные ошибки. В настоящий момент СинТагРус содержит 41187 аннотированных предложений.
Пополнение поэтического корпуса (добавлены тексты ряда авторов XVIII – XIX в., включая сборники второстепенных поэтов 1790–1830-х годов «Библиотеки поэта»). Доступен список авторов поэтического корпуса с возможностью перехода на подкорпуса текстов каждого из них.
В основном корпусе доступны опции поиска слов в составе идиоматических оборотов и вне оборотов. Доступен также расширенный семантический поиск по первому/не первому значению слова, а также в части контекстов, где разрешена лексико-семантическая омонимия.