Национальный корпус русского языка — представительная коллекция текстов
на русском языке
общим объемом более 2 млрд слов,
оснащенная лингвистической разметкой и инструментами поиска
Поиск по корпусам
Новости
В Портрете слова Основного, Обучающего, Газетных корпусов, а также корпусов «От 2 до 15» и «Русская классика» появилось сравнение скетчей!
Новый функционал позволяет увидеть сходства и различия в употреблении двух слов. Например, можно узнать, что общего у времени и денег или увидеть, что бывает колючим, а что – колким.
Cравнение скетчей доступно для существительных, прилагательных, глаголов и наречий. Сравнить можно две леммы, относящиеся к одной и той же части речи. Для слов, встретившихся менее чем в 3 разных текстах, а также для имен собственных, аббревиатур и слов, имеющих нестандартные написания, скетчи не выводятся и сравнение скетчей недоступно.
Для сравнения отбирается по топ-6 коллокатов для каждого ключа. В сравнительной таблице может быть меньше 12 коллокатов в случае, если не набралось 6 коллокатов для одного или обоих ключей или есть пересечения в топ-6.
Мультимедийный корпус пополнен на 107 тыс. словоупотреблений. В него были добавлены: коллекция записей художественного чтения — рассказы А.П. Чехова в исполнении известных актеров Александра Борисова, Леонида Броневого, Игоря Ильинского, Ростислава Плятта; две театральные постановки, записи телевизионных ток-шоу. Значительно пополнена коллекция записей региональной речи. В нее вошли беседы и интервью с жителями Нижегородской, Мурманской, Рязанской, Свердловской, Тверской областей, Краснодарского края, Якутии и др., которые являются героями сюжетов документальных фильмов из цикла «Письма из провинции» и видеоблогов.
В корпусе появилась возможность отбора подкорпуса по региону.
В исторических корпусах «Берестяные грамоты» и «Эпиграфика» появились фотографии и прориси исходных грамот и надписей.
По умолчанию в конкордансе видны изображения в формате превью: слева расположены фотографии, а справа — прориси. Щелчок по картинке открывает ее в полноэкранном режиме, где можно увеличивать или уменьшать рисунки и фотографии, а также скачивать их.
В режиме KWIC и при выборе подкорпуса изображения можно увидеть только в полноэкранном режиме, щелкнув по иконке справа от заголовка текста.
Для скрытия изображений предусмотрена соответствующая настройка. Эта опция сохраняется в браузере пользователя: при следующем обращении к корпусу настройки сохранятся и выдача будет отображаться без картинок.
Новый функционал реализован благодаря сотрудничеству с командами разработчиков сайтов gramoty.ru и epigrafika.ru. На этих платформах представлена более подробная информация о грамотах и надписях. Мы выражаем благодарность нашим коллегам и надеемся на дальнейшее успешное сотрудничество.
Корпус «Русская классика» пополнен академическими полными собраниями сочинений Александра Сергеевича Грибоедова и Федора Ивановича Тютчева. Наследие этих писателей сравнительно невелико по объему (причем по-русски Тютчев написал даже меньше, чем «автор одной книги» Грибоедов), однако их язык представляет большой интерес с различных точек зрения. В корпус входят варианты, представленные в разных редакциях текстов. Все тексты корпуса заново размечены с учетом улучшений в языковой модели Рубик.