Новости НКРЯ

Обновление поэтического корпуса. Добавлены произведения поэтов начала и середины XX в.: С. Дрожжина, В. Брюсова, А. Блока, Андрея Белого, М. Кузмина, В. Гофмана, Н. Гумилева, С. Городецкого, О. Мандельштама, Г. Иванова, Г. Адамовича, М. Моравской, В. Меркурьевой, Вс. Рождественского, А. Адалис, А. Ладинского. Общий объём новых текстов – более 800 тыс. словоупотреблений.

Произошло обновление акцентологического и устного корпусов.

Для общего доступа открыт Мультимедийный русский корпус (МУРКО).

На странице результатов поиска появилось несколько полезных инструментов:

  • по ссылке «Посмотреть частотный словарь» можно перейти к списку самых частотных лемм и словоформ среди найденных документов;
  • теперь можно сохранить результаты с текущей страницы выдачи в электронной таблице (Microsoft Excel, OpenOffice Calc);
  • добавлена возможность случайного перемешивания результатов поиска (чтобы ее включить, перейдите в окно «Настройки» и выберите пункт «Сортировать случайно»).

Пополнение и усовершенствование функциональности Корпуса:

  • — проведена унификация разметки в основном корпусе со снятой омонимией (вид и залог глагольной лексемы, формы причастий и деепричастий, ударение частотных словоформ имён собственных и несловарных слов, разбор имён собственных, сокращений, иностранных слов, ряд мелких исправлений);
  • — пополнен основной корпус с неснятой омонимией: художественные и публицистические тексты XIX – первой половины XX века, мемуары второй половины XX века, научные тексты, научно-популярные и общественно-политические журналы 1950-1980-х годов, газеты 1990-х годов, тексты электронной коммуникации, официально-деловые тексты. Объём основного корпуса достиг 176 млн словоупотреблений.
  • — пополнен корпус поэтических текстов: творчество поэтов XIX – начала XX в. (материалы выпусков «Библиотеки поэта»: «Поэты 1840-х гг.», «Поэты-петрашевцы», «Поэты 1860-х гг.», «Поэты 1880-1890-х гг.»; авторские сборники поэтов: И. Мятлев, М. Михайлов, Н. Щербина, П. Соловьева, А. Добролюбов, К. Бальмонт, Ю. Балтрушайтис, Е. Дмитриева (Черубина де Габриак), Л. Кобылинский (Эллис), А. Кондратьев, Б. Садовской, Т. Щепкина-Куперник, А. Скалдин, С. Соловьев, А. Тиняков, Вяч. Иванов, М. Волошин). Объём поэтического корпуса достиг 5 млн словоупотреблений.
  • — пополнен корпус параллельных текстов, достигающий 9 млн словоупотреблений; добавлены англо-русские (Э. Бронте, Дж. Голсуорси, К. Льюис, К. Воннегут и др.) и немецко-русские (Новалис, Й. фон Эйхендорф, Г. Гессе, Г. Бёлль и др.) параллельные тексты. Впервые доступны для поиска украинско-русский и русско-украинский параллельные корпуса (500 тыс. словоупотреблений).

Доступна выдача в формате KWIC (key word in context) с выравниванием ключевых слов по центру. Чтобы включить этот режим, пройдите по ссылке «формат KWIC» или «настройки» в верхней части страницы выдачи.

Выложена новая версия глубоко аннотированного корпуса русских текстов СинТагРус.

Появилась форма для сообщения об ошибках в тексте. Чтобы сообщить об ошибке в разметке слова или документа, выделите его мышкой и во всплывающем окне нажмите «Сообщить об ошибке». 
Также на странице с результатами поиска появились ссылки на поиск в других корпусах.

Доступен для поиска Корпус современной русской прессы (газеты и сообщения новостных интернет-агентств за период 2000—2008 гг) объёмом около 100 млн словоупотреблений. Тексты предоставлены компанией Corpus Technologies.