Новости НКРЯ
Пополнены коллекции устной речи в Акцентологическом и Устном корпусах. Добавлены записи текстов устной научной и политической речи, теле- и радиопублицистики, устных монологов-воспоминаний, повседневной диалогической речи. Объем Устного корпуса составляет 14 млн словоупотреблений, общий объем Акцентологического корпуса, вместе с наивной поэзией, - 134,8 млн словоупотреблений.
Параллельный корпус пополнился на 3 млн слов. Новые тексты появились в английской, испанской, немецкой, португальской, французской и чешской языковых парах. В частности, англо-русский корпус пополнился коллекцией расшифровок публичных лекций TED Talks, а португальско-русский вырос почти вдвое и теперь включает еще и тексты, созданные в португалоязычной Африке.
В корпусе Социальные сети автоматически размечены жанры для всего массива текстов. Пользователь может выбрать один или несколько жанров из списка. Выделено несколько новых жанров, например, подпись к фото.
Поля в информации о тексте, значения которых сгенерированы НейроКРЯ, помечены специальным значком. Если вы заметили неточность или ошибку, сообщайте нам, используя кнопку “Сообщить об ошибке” в том же окне.