Новости

15.09.2023

Акцентологический корпус переведен на новый интерфейс. Теперь поиск по корпусу отображается в новом дизайне, доступны «Портреты слов» акцентологического корпуса. Корпус подключен к «Обзору возможностей».

Усовершенствован Портрет слова в основном корпусе:
В виджете “Морфемный разбор” разведены альтернативные морфемные разборы для разных частей речи. Например, слово тепло как существительное разбирается иначе, чем как наречие. Разные разборы можно увидеть, переключаясь в портрете между частями речи.

25.08.2023

Поэтический корпус переведен на новый интерфейс. Теперь поиск по корпусу отображается в новом дизайне, доступны «Портреты слов» поэтического корпуса. Пользователь может увидеть результаты поиска в режиме «с формулами» — каждая строка стихотворения будет снабжена поэтической разметкой. При показе расширенного контекста доступно все стихотворение полностью. На странице отбора подкорпуса можно создать подкорпус из текстов нескольких авторов и задать условия на другие метаатрибуты.

В новом разделе «Авторы» в портрете корпуса отображается список всех авторов, представленных в поэтическом корпусе. Список может быть отсортирован по алфавиту, по датам рождения и смерти, а также по полу автора. Алфавитный фильтр позволяет просматривать только тех авторов, фамилия которых начинается на заданную букву. Выбрав одного автора в списке, можно создать подкорпус, состоящий только из его текстов.

В «Обзоре возможностей» появился виджет «Случайное стихотворение»: для любого слова или словосочетания подбирается случайный пример из поэтического корпуса.

В таблицах под графиком выдачи по годам в Основном корпусе теперь отображаются количество текстов и количество примеров в результатах поиска и в корпусе в целом.

21.07.2023

В корпусе «Социальные сети» исправлены ошибочные датировки и устранены повторы текстов. Теперь корпус стал действенным инструментом по изучению диахронии языковых явлений: так, доступна хронология употребительности получающих популярность или выходящих из моды языковых единиц (ср. хайп, преведуметь во что-л.).
В корпус включена коллекция текстов социальных сетей, подготовленная сотрудниками и студентами Воронежского государственного университета. В нее вошли материалы «Большого воронежского форума» и других локальных сетей Воронежа, записи известных воронежских блогеров, обсуждения в местных группах на популярных платформах VK, Telegram, Livejournal и др. — всего около 22,8 млн словоупотреблений. Тексты воронежской коллекции имеют более подробную метатекстовую разметку  и охватывают период 2001—2023 годов. В дальнейшем планируется включить в корпус материалы социальных сетей других регионов России.

21.07.2023

Портрет слова в Основном корпусе пополнился данными об однокоренных словах. В новом виджете сейчас показаны гнезда однокоренных слов. Пока эта опция доступна только для слов с одним корнем (например, стол, но не пароход), которые размечены вручную в словаре морфемного анализа. Данные о других словах появятся в ближайшие месяцы, но и сейчас в Портрете можно увидеть интересные связи между словами.

По традиции рядом с новым виджетом вы увидите кнопку «‎Оценить» и сможете сообщить нам о замеченных ошибках. Благодаря вашей обратной связи мы регулярно улучшаем нейролингвистические модели, лежащие в основе Портрета слова. Нам очень интересно и важно, что вы думаете о первой версии модели однокоренных слов.

Появилась возможность точнее задавать условия лексико-грамматического поиска в основном, газетном и региональном корпусах. Как вы знаете, в форме поиска можно задавать условия на расстояние между словами. До сегодняшнего дня если заданный диапазон включал 0 (например, от -1 до 1), то в результатах поиска найденные слова могли совпадать. Теперь вверху формы поиска можно выбрать опцию «совпадения слов исключаются» чтобы убрать нулевое расстояние из диапазона. Например, можно выяснить, рядом с какими одушевленными существительными во множественном числе перечисляются крестьяне, причем с любым порядком сочинения (рабочие и крестьяне, крестьян и мещан…). Вот получившийся список.  Раньше аналогичный запрос находил бы и слово крестьянин во множественном числе в одиночестве, без «соседей» (поскольку при расстоянии 0 оно само удовлетворяет всем условиям на сочиненное существительное).

Подпишитесь на наш телеграм канал, чтобы следить за обновлениями и получать иллюстрированные инструкции  по работе с корпусом.