Ошибки в корпусе

Национальный корпус русского языка — значительный по объёму проект, тексты которого собирались и обрабатывались отчасти автоматически в короткие сроки. В этих условиях Корпус, как и все большие языковые корпуса, не свободен от ошибок.

Следует учитывать, что не всё, что может показаться неподготовленному пользователю ошибкой Корпуса, в действительности ей является. Например, в текстах с неснятой омонимией приводятся все допустимые морфологические разборы словоформ, поэтому на запрос с участием дательного падежа могут находиться формы предложного, на запрос глагола знать — существительное знать и т. п.

Ошибки в Корпусе могут иметь разную природу, связанную как с программным, так и с человеческим фактором: опечатки в тексте (в том числе связанные с неверным распознаванием отсканированного текста), отсутствие правильного морфологического разбора (в том числе связанное с отсутствием словоформы в словаре анализатора, с неверным выбором разбора разметчиком), неточности в информации о тексте, в частности, в его датировке.

Если вы заметили ошибку в Национальном корпусе русского языка, вы можете сообщить администрации Корпуса об этом при помощи специального механизма. Если ошибка встретилась в написании или разборе слова, щёлкните левой кнопкой мыши на этом слове и внизу окна грамматического разбора выберите «Сообщить об ошибке...», после чего в открывшемся окошке внизу кратко напишите, в чём заключается ошибка, и нажмите «Отправить». Если ошибка встретилась в метаинформации текста, щёлкните на названии текста и внизу окна метатекстовых признаков выберите «Сообщить об ошибке...», после чего в окошке внизу кратко напишите, в чём заключается ошибка, и нажмите «Отправить».

Замеченная вами ошибка будет исправлена не моментально, а при ближайшей переиндексации текстов корпуса. Переиндексация производится примерно два раза в год.

Национальный корпус русского языка
© 2003–2017
info@ruscorpora.ru