← Вернуться к старой версии Вы находитесь в новой версии Сообщить об ошибке Подробнее

Использование корпуса

Все результаты интеллектуальной деятельности, используемые в НКРЯ и размещаемые в сети Интернет по адресу https://www.ruscorpora.ru/, доступны исключительно для некоммерческого использования в научно-исследовательских и учебных целях (в соответствии со статьей 1274 ГК РФ). Они не предназначены ни для чтения/просмотра, ни для копирования, ни для иных видов использования: их можно использовать в режиме поиска как источники примеров (цитат), иллюстрирующих то или иное языковое явление. При цитировании примеров, полученных с помощью НКРЯ, необходимо ссылаться на НКРЯ как источник примеров, а также, в случае, если пример носит бесспорно авторский характер, указывать имена авторов текста и его название.

Для получения офлайновой версии корпуса, а также диахронических датасетов НКРЯ, необходимо подписать соответствующее лицензионное соглашение и выслать заявку с заполненным отсканированным лицензионным соглашением по адресу np-rnc@yandex.ru. В заявке укажите цели использования данных.

В настоящий момент доступны следующие данные:

Офлайновая версия основного корпуса со снятой морфологической омонимией (объём около 1 млн словоупотреблений) — лицензионное соглашение

Диахронические датасеты НКРЯ (совокупный объём наборов данных — 250 миллионов словоупотреблений) — лицензионное соглашение
Диахронические наборы данных охватывают три периода — 1700-1916, 1918-1991 и 1992-2016 годы и отвечают приблизительно трём историческим периодам развития общества и русского языка Нового времени («досоветскому», «советскому» — включая, разумеется, и тексты эмиграции, — и «постсоветскому»).
Каждый из этих периодов представлен большим текстовым файлом в кодировке UTF-8, где в произвольном порядке находятся предложения исходных текстов. Такое нарушение целостности текстов связано с требованиями защиты авторских прав. Тексты не снабжены морфологической либо метатекстовой разметкой.

Составители Корпуса будут также признательны за сообщение обо всех обнаруженных ошибках и неточностях и за предложения по совершенствованию Корпуса.

Почтовый адрес администрации Корпуса: 119019 Москва, Волхонка, 18/2, Институт русского языка им. В. В. Виноградова РАН, Отдел корпусной лингвистики и лингвистической поэтики.

Национальный корпус русского языка
© 2003–2022
info@ruscorpora.ru