Новости НКРЯ

Мы обновили Обучающий корпус, добавив в него более 1000 новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, включая те, которые рекомендуются для внеклассного чтения.

Но это еще не всё. Для морфологической разметки всех текстов мы использовали нейросетевые модели. В процессе автоматической разметки снята грамматическая омонимия, что позволило нам добавить в Обучающий корпус современные инструменты для анализа слов и текстов.

Портрет слова показывает его сочетаемость, похожие слова, частоту использования, формы и историю употребления, а также примеры из текстов корпуса. Для сравнения частоты употребления слов и словосочетаний можно использовать Сравнение запросов

Можно анализировать и тексты. Для этого есть инструмент Портрет Корпуса, который предоставляет информацию об истории создания и о составе корпуса, а также статистику и частотный словарь. С помощью Портрета подкорпуса можно анализировать особенности выбранных текстов и сравнивать их с остальными текстами в корпусе.

При помощи новых инструментов можно составлять более разнообразные задания для школьников. Ученики могут использовать их и для самостоятельных исследований, например, чтобы написать реферат. А для тех преподавателей и студентов, кто готов проводить более сложные исследования, мы добавили новые виды выдачи результатов поиска (Статистика, Частотность, N-граммы) и новый вид поиска – Поиск коллокаций.

Показать все