Новости НКРЯ
Пополнение корпуса с неснятой грамматической омонимией. Добавлены тексты общим объёмом 20,5 млн словоупотреблений: специальные и региональные газеты и журналы, художественная литература XX в., тексты разных жанров (художественные, научные, религиозные) XVIII—XIX в.
Открыт корпус выровненных параллельных текстов (русско-английский и англо-русский); доступен лексико-грамматический поиск по оригинальным текстам (с неснятой грамматической омонимией).
Пополнение корпуса с неснятой грамматической омонимией — добавлены тексты общим объёмом 11 млн словоупотреблений, общий объём корпуса с неснятой грамматической омонимией превысил 65 млн слов. Среди новых текстов — драматические произведения, тексты XIX и начала XX веков, современная художественная литература, периодика, материалы Интернет-форумов.
Значительное пополнение корпуса со снятой грамматической омонимией, в котором теперь представлены также нехудожественные жанры (газетные, журнальные статьи, мемуары, научно-технические, церковно-богословские тексты; записи устной речи). Общий объём корпуса со снятой грамматической омонимией достиг 3,8 млн словоупотреблений в 1000 документах. Эти тексты акцентуированы и доступны для лексико-семантического поиска.
Реализована функция «расширение контекста». Пользователю, помимо выдаваемого по умолчанию контекста длиной в одно предложение, доступен также расширенный контекст длиной в 7 предложений (по 3 предложения слева и справа).
Значительное пополнение корпуса с неснятой грамматической омонимией. Добавлены и проиндексированы тексты общим объемом 15 млн словоупотреблений: художественная литература XIX — первой половины XX века; художественная литература 1960 — 1970-х гг. (включая фантастику и детскую литературу); учебно-научные тексты, специальные и региональные журналы и газеты 1990 — 2000-х гг., массовая литература (детективы, любовные романы) этого же периода. Общий объём корпуса превысил 50 млн словоупотреблений.
Доступна версия для сохранения/печати (в том числе вариант со снятием ударений в акцентуированных текстах). В выдаче указывается количество не только документов, но и контекстов (если найдено слишком много, то число контекстов оценивается приблизительно).
Расширены возможности лексико-грамматического поиска в корпусе. Доступна экспериментальная система поиска по семантическим и словообразовательным характеристикам лексем (семантическая неоднозначность в настоящее время не снята).
Пополнение корпуса с неснятой грамматической омонимией. Добавлены и проиндексированы тексты общим объемом 3 млн словоупотреблений: пресса (центральная и региональная), научные издания, художественная литература, мемуары, стенограммы устной речи.
Доступна страница статистики корпуса.
Внимание: несколько изменен язык запросов. Логическое «ИЛИ» задается при помощи знака |, логическое«И» при помощи пробела или & (см. подробнее)
Значительное пополнение корпуса с неснятой грамматической омонимией. Добавлены и проиндексированы тексты общим объемом 11 млн словоупотреблений: художественная литература (в том числе произведения В. Астафьева, Г. Бакланова, Ю. Давыдова, В. Шукшина), мемуары (в том числе М. Цветаевой, А. Мариенгофа, Н. Гершензон-Чегодаевой), церковно-богословские тексты.
Cайт «Национального корпуса русского языка» http://ruscorpora.ru открыт для широкой аудитории. Поддержка сайта и поиск по корпусу осуществляется компанией «Яндекс».
Исправлены некоторые ошибки в поисковом запросе и выдаче: в частности, выдается 20 первых контекстов из каждого текста, работает "простой" (лексический) поиск, работает знак * в начале запроса, а также логическое отрицание при лексеме.
По адресу http://www.ruscorpora.ru открыта первая версия сайта "Национального корпуса русского языка"
Создан макет сайта (И. В. Сегалович)