Новости НКРЯ
Произошло обновление и пополнение ряда корпусов: основного, параллельного, поэтического, акцентологического, устного. Общий объем корпусов превысил 340 млн словоупотреблений. Обновлена страница со статистикой.
В результатах поиска во всплывающих окошках с информацией о слове появились гиперссылки на словарные статьи из коллекции Яндекс.Словарей.
Для свободного пользования выложена случайная выборка предложений (с нарушенным порядком) из корпуса со снятой омонимией объёмом 180 тыс. словоупотреблений (90 тыс. – пресса, по 30 тыс. из художественных текстов, законодательства и научных текстов).
Обновление поэтического корпуса. Добавлены произведения поэтов начала и середины XX в.: С. Дрожжина, В. Брюсова, А. Блока, Андрея Белого, М. Кузмина, В. Гофмана, Н. Гумилева, С. Городецкого, О. Мандельштама, Г. Иванова, Г. Адамовича, М. Моравской, В. Меркурьевой, Вс. Рождественского, А. Адалис, А. Ладинского. Общий объём новых текстов – более 800 тыс. словоупотреблений.
Произошло обновление акцентологического и устного корпусов.
Для общего доступа открыт Мультимедийный русский корпус (МУРКО).
На странице результатов поиска появилось несколько полезных инструментов:
- по ссылке «Посмотреть частотный словарь» можно перейти к списку самых частотных лемм и словоформ среди найденных документов;
- теперь можно сохранить результаты с текущей страницы выдачи в электронной таблице (Microsoft Excel, OpenOffice Calc);
- добавлена возможность случайного перемешивания результатов поиска (чтобы ее включить, перейдите в окно «Настройки» и выберите пункт «Сортировать случайно»).
Пополнение и усовершенствование функциональности Корпуса:
- — проведена унификация разметки в основном корпусе со снятой омонимией (вид и залог глагольной лексемы, формы причастий и деепричастий, ударение частотных словоформ имён собственных и несловарных слов, разбор имён собственных, сокращений, иностранных слов, ряд мелких исправлений);
- — пополнен основной корпус с неснятой омонимией: художественные и публицистические тексты XIX – первой половины XX века, мемуары второй половины XX века, научные тексты, научно-популярные и общественно-политические журналы 1950-1980-х годов, газеты 1990-х годов, тексты электронной коммуникации, официально-деловые тексты. Объём основного корпуса достиг 176 млн словоупотреблений.
- — пополнен корпус поэтических текстов: творчество поэтов XIX – начала XX в. (материалы выпусков «Библиотеки поэта»: «Поэты 1840-х гг.», «Поэты-петрашевцы», «Поэты 1860-х гг.», «Поэты 1880-1890-х гг.»; авторские сборники поэтов: И. Мятлев, М. Михайлов, Н. Щербина, П. Соловьева, А. Добролюбов, К. Бальмонт, Ю. Балтрушайтис, Е. Дмитриева (Черубина де Габриак), Л. Кобылинский (Эллис), А. Кондратьев, Б. Садовской, Т. Щепкина-Куперник, А. Скалдин, С. Соловьев, А. Тиняков, Вяч. Иванов, М. Волошин). Объём поэтического корпуса достиг 5 млн словоупотреблений.
- — пополнен корпус параллельных текстов, достигающий 9 млн словоупотреблений; добавлены англо-русские (Э. Бронте, Дж. Голсуорси, К. Льюис, К. Воннегут и др.) и немецко-русские (Новалис, Й. фон Эйхендорф, Г. Гессе, Г. Бёлль и др.) параллельные тексты. Впервые доступны для поиска украинско-русский и русско-украинский параллельные корпуса (500 тыс. словоупотреблений).
Доступна выдача в формате KWIC (key word in context) с выравниванием ключевых слов по центру. Чтобы включить этот режим, пройдите по ссылке «формат KWIC» или «настройки» в верхней части страницы выдачи.