Новости НКРЯ
Для общего доступа открыт Церковнославянский корпус как первый из разделов Исторического корпуса. Основу церковнославянского корпуса составляют современные богослужебные тексты (XIX-XX век) (60%). Кроме того, в корпусе представлены тексты других периодов (XVII-XVIII век) и жанров: писание, святоотеческие и др. Общий объем корпуса – около 4,7 млн словоупотреблений. Тексты в корпусе снабжены морфологической разметкой, которая позволяет искать слова по лемме и грамматическим признакам. Пользователь может искать словоформы и леммы в трех орфографических системах: точной, упрощенной и модернизированной.
1. Очередное обновление и пополнение ряда корпусов: основного, акцентологического, мультимедийного, параллельного, поэтического, устного. Объем основного корпуса превысил 209 млн словоупотреблений, а общий объем корпусов – 364 млн словоупотреблений.
2. На странице выбора подкорпуса основного корпуса теперь можно выбирать документы, добавленные или изменненные в определенных версиях корпуса.
3. Вкладки с корпусами теперь расположены слева в меню «поиск в корпусе».
В режиме бета-тестирования запущен новый сервис: распределение результатов поиска по точным формам в основном корпусе по годам.
В формах для ввода слов в лексико-грамматическом поиска появились «подсказки», позволяющие быстро выбрать наиболее частотную лемму.
Появилась возможность искать слова, расположенные в начале или в конце предложений. Включить эти параметры можно через форму выбора дополнительных признаков в лексико-грамматическом поиске
Произошло обновление и пополнение ряда корпусов: основного, параллельного, поэтического, акцентологического, устного. Общий объем корпусов превысил 340 млн словоупотреблений. Обновлена страница со статистикой.
В результатах поиска во всплывающих окошках с информацией о слове появились гиперссылки на словарные статьи из коллекции Яндекс.Словарей.
Для свободного пользования выложена случайная выборка предложений (с нарушенным порядком) из корпуса со снятой омонимией объёмом 180 тыс. словоупотреблений (90 тыс. – пресса, по 30 тыс. из художественных текстов, законодательства и научных текстов).
Обновление поэтического корпуса. Добавлены произведения поэтов начала и середины XX в.: С. Дрожжина, В. Брюсова, А. Блока, Андрея Белого, М. Кузмина, В. Гофмана, Н. Гумилева, С. Городецкого, О. Мандельштама, Г. Иванова, Г. Адамовича, М. Моравской, В. Меркурьевой, Вс. Рождественского, А. Адалис, А. Ладинского. Общий объём новых текстов – более 800 тыс. словоупотреблений.
Произошло обновление акцентологического и устного корпусов.
Для общего доступа открыт Мультимедийный русский корпус (МУРКО).