Архив новостей Национального корпуса русского языка
23 июля 2010 года
Пополнение и усовершенствование функциональности Корпуса:
- — проведена унификация разметки в основном корпусе со снятой омонимией
(вид и залог глагольной лексемы, формы причастий и деепричастий,
ударение частотных словоформ имён собственных и несловарных слов,
разбор имён собственных, сокращений, иностранных слов, ряд мелких исправлений);
- — пополнен основной корпус с неснятой омонимией:
художественные и публицистические тексты XIX – первой половины XX века,
мемуары второй половины XX века, научные тексты, научно-популярные и общественно-политические журналы 1950-1980-х годов,
газеты 1990-х годов, тексты электронной коммуникации,
официально-деловые тексты.
Объём основного корпуса достиг 176 млн словоупотреблений.
- — пополнен корпус поэтических текстов:
творчество поэтов XIX – начала XX в.
(материалы выпусков «Библиотеки поэта»:
«Поэты 1840-х гг.»,
«Поэты-петрашевцы»,
«Поэты 1860-х гг.»,
«Поэты 1880-1890-х гг.»;
авторские сборники поэтов: И. Мятлев, М. Михайлов,
Н. Щербина, П. Соловьева, А. Добролюбов, К. Бальмонт,
Ю. Балтрушайтис, Е. Дмитриева (Черубина де Габриак),
Л. Кобылинский (Эллис), А. Кондратьев, Б. Садовской,
Т. Щепкина-Куперник, А. Скалдин, С. Соловьев,
А. Тиняков, Вяч. Иванов, М. Волошин).
Объём поэтического корпуса достиг 5 млн словоупотреблений.
- — пополнен корпус параллельных текстов,
достигающий 9 млн словоупотреблений;
добавлены англо-русские (Э. Бронте, Дж. Голсуорси,
К. Льюис, К. Воннегут и др.)
и немецко-русские (Новалис, Й. фон Эйхендорф,
Г. Гессе, Г. Бёлль и др.) параллельные тексты.
Впервые доступны для поиска украинско-русский
и русско-украинский параллельные корпуса (500 тыс. словоупотреблений).
8 июля 2010 года
Доступна выдача в формате KWIC (key word in context) с выравниванием ключевых слов по центру. Чтобы включить этот режим, пройдите по ссылке «формат KWIC» или «настройки» в верхней части страницы выдачи.
15 июня 2010 года
Выложена новая версия глубоко аннотированного корпуса русских текстов СинТагРус.
4 июня 2010 года
Появилась форма для сообщения об ошибках в тексте.
Чтобы сообщить об ошибке в разметке слова или документа, выделите его мышкой и во всплывающем окне нажмите «Сообщить об ошибке».
Также на странице с результатами поиска появились ссылки на поиск в других корпусах.
3 февраля 2010 года
Доступен для поиска Корпус современной русской прессы (газеты и сообщения новостных интернет-агентств за период 2000—2008 гг) объёмом около 100 млн словоупотреблений. Тексты предоставлены компанией Corpus Technologies.
1 января 2010 года
В 2009 году вышли два сборника,
в которых принимал непосредственное участие коллектив разработчиков Корпуса:
- Национальный корпус русского языка: 2006—2008. Новые результаты и перспективы.
— СПб.: Нестор-История, 2009. — 502 с.
- Корпусные исследования по русской грамматике. — М., Пробел, 2009. — 516 с.
18 ноября 2009 года Национальный
корпус русского языка стал
обладателем специального приза конкурса
работников электронных средств массовой информации «За образцовое
владение русским языком в профессиональной деятельности»
18 ноября 2009 года На сайте
Института русского языка РАН размещены
словари, созданные на основе
Национального корпуса русского языка: грамматический словарь новых
слов русского языка, новый
частотный словарь русской лексики, словарь
сочетаемости слов со значением высокой степени, словарь глагольной
сочетаемости непредметных имён русского языка.
18 ноября 2009 года
Выложена новая версия глубоко аннотированного корпуса русских текстов СинТагРус.
По сравнению с предыдущей версией в корпус было добавлено 88 современных статей научно-популярной, экономической и общественно-политической тематики,
опубликованных в российской периодической печати в 2007-2008 гг. Попутно были исправлены замеченные ошибки.
В настоящий момент СинТагРус содержит 41187 аннотированных предложений.
2 ноября 2009 года Открыт образовательный портал
Национального корпуса русского языка.
2 ноября 2009 года Пополнение
поэтического корпуса (добавлены тексты ряда авторов XVIII – XIX в., включая сборники второстепенных поэтов 1790–1830-х годов
«Библиотеки поэта»). Доступен список авторов поэтического
корпуса с возможностью перехода на подкорпуса текстов каждого из них.
26 февраля 2009 года В основном корпусе доступны опции поиска
слов в составе идиоматических оборотов и вне
оборотов. Доступен также расширенный семантический поиск по первому/не первому
значению слова, а также в части контекстов, где разрешена
лексико-семантическая омонимия.
25 февраля 2009 года Пополнение
параллельного корпуса; добавлен немецко-русский корпус (доступен для
лексико-грамматического поиска в общей
форме параллельных корпусов).
12 января 2009 года Пополнение корпусов. Расширены устный корпус (объём достиг 7,8 млн слов), акцентологический корпус (объём достиг 4,45 млн слов).
25 декабря 2008 года Пополнение корпусов. Расширены основной корпус (тексты первой половины XX в. — объём достиг 40 млн слов, тексты XVIII в. — объём достиг 2,6 млн слов), поэтический корпус (объём достиг 3 млн слов).
8 декабря 2008 года Вновь доступны для поиска англо-русский и
русско-английский параллельный корпуса; теперь они размещены на
основном сайте НКРЯ и проиндексированы аналогично остальным
подкорпусам.
10 ноября 2008 года Доступен англоязычный интерфейс поиска по основному корпусу.
24 октября 2008 года Доступен поиск в корпусе
«История русского ударения», содержащий поэтические и
акцентуированные устные тексты. При его помощи можно узнать, как эволюционировало русское ударение, например, в словах музыка или поднялись.
20 октября 2008 года Доступен словарь редких слов, предназначенный для обучения. Его задача — разрешить лексические трудности, возникающие при чтении текстов, дать представление о грамматических и стилистических особенностях редких слов. См. описание словаря.
3 октября 2008 года Доступен словарь неоднословных лексических единиц (оборотов) — таких, как предложный оборот во имя, наречный оборот без запинки, вводный оборот таким образом и т. п.
13 мая 2008 года По техническим причинам поиск по параллельному корпусу закрыт на профилактику.
Коллектив корпуса приносит свои извинения за причинённые неудобства.
16 апреля 2008 года Открыт поиск по параллельному русско-немецкому и немецко-русскому корпусам.
26 марта 2008 года Открыт поиск по корпусу устной речи.
18 марта 2008 года Открыт поиск по корпусу синтаксически размеченных текстов.
17 марта 2008 года Открыта англоязычная версия сайта Национального корпуса руссого языка.
Интерфейс поиска по корпусу пока доступен только на русском языке; английская версия будет добавлена в ближайшее время.
28 января 2008 года На сайте размещена библиография публикаций по Корпусу (статьи из сборника 2005 г. доступны в формате PDF). Добавлен список ссылок на другие общедоступные корпуса русского языка. Обновлена статистика Корпуса.
22 января 2008 года Задействован поиск повтора предыдущей лексемы или грамматической характеристики (в поле «дополнительные признаки»). Размещены инструкции пользователя в формате PDF к основному и обучающему корпусам.
16 января 2008 года В «Настройках» на странице выдачи доступна сортировка выдачи по правому или левому контексту.
28 декабря 2007 года Пополнение корпуса со снятой омонимией, объём которого составил около 6 млн словоупотреблений. Добавлены тексты XVIII — 1-й половины XX века, современные нехудожественные тексты (публицистика, специальные тексты, материалы электронной коммуникации)
Пополнение корпуса с неснятой омонимией на 16 млн словоупотреблений. Включены тексты первой половины XX в. (включая также большой массив нехудожественных: мемуары, официальные документы), драматические произведения различных периодов, публицистические и художественные тексты 1960-1980-х гг.
13 декабря 2007 года Пополнение поэтического корпуса — включены тексты авторов XVIII—XIX вв. (от Кантемира до Огарёва) и трёх авторов XX в. (Бунин, Анненский, Мандельштам); всего около 1 млн словоупотреблений. Появилась возможность поиска по дополнительным параметрам (частные особенности метрики, строфики, рифмы).
Пополнение диалектного корпуса — общий объём корпуса составляет 150 тысяч словоупотреблений. Значительно расширилась тематика и география представленных текстов.
26 ноября 2007 года На сайте размещён обучающий корпус — предназначенный для образовательных целей корпус с дополнительными грамматическими параметрами, предусмотренными школьной программой (типы склонений, разряды местоимений и др.).
Добавлена возможность регулировать настройки выдачи поиска (количество документов или контекстов на странице, сортировка).
8–11 июня 2007 года
Национальный корпус русского языка участвует в выставке
«Инновационные достижения России»
в рамках
XI Петербургского международного экономического форума.
26 декабря 2006 года
Масштабное обновление Корпуса:
1. Открытие двух новых составляющих корпусов: корпуса поэтических текстов (ряд авторов первой половины XIX в.),
снабжённого, помимо обычной морфологической и семантической, разметкой параметров стиха -- рифмы, строфики,
метрики, -- и корпуса диалектных текстов, снабжённого лингвистической разметкой специфических диалектных форм.
2. Открытие в составе главного корпуса особого подкорпуса живой русской речи: расширение массива устных публичных и
непубличных текстов. добавления текстов мультимедиа (кинофильмов).
3. Пополнение основного корпуса со снятой грамматической омонимией, в основном записями устной речи и текстами
XVIII — первой половины XX в.
4. Пополнение основного корпуса с неснятой грамматической омонимией: художественная литература, научные журналы,
тексты 1750-1950 гг.
21 июня 2006 года
Расширен поиск по лексико-семантическим признакам. Теперь можно искать
имена собственные: ФИО, топонимы и названия учреждений.
7 февраля 2006 года
Пополнение корпуса с неснятой омонимией (до объёма 120 млн словоупотреблений): добавлены научные тексты, художественные произведения, тексты XIX века (разных жанров), советская пресса середины XX века, записи устной речи (публичных выступлений и непубличных микродиалогов).
Доступен поиск по подкорпусу устной речи.
Доступна лексико-семантическая разметка на корпусе с неснятой омонимией.
19 декабря 2005 года
На сайте работает виртуальная клавиатура (кнопка справа от поля ввода).
Теперь, пользуясь только мышью, вы можете
ввести в строку запроса русские лексемы и словоформы на компьютере, где
нет русской клавиатуры.
14 декабря 2005 года
Пополнение корпуса с неснятой грамматической омонимией. Добавлены тексты общим объёмом 20,5 млн словоупотреблений: специальные и региональные газеты и журналы, художественная литература XX в., тексты разных жанров (художественные, научные, религиозные) XVIII—XIX в.
28 октября 2005 года
Открыт корпус выровненных параллельных текстов (русско-английский и англо-русский); доступен лексико-грамматический поиск по оригинальным текстам (с неснятой грамматической омонимией).
19 августа 2005 года
Пополнение корпуса с неснятой грамматической омонимией — добавлены тексты общим объёмом 11 млн словоупотреблений,
общий объём корпуса с неснятой грамматической омонимией превысил 65 млн слов. Среди новых текстов — драматические
произведения, тексты XIX и начала XX веков, современная художественная литература, периодика, материалы
Интернет-форумов.
13 мая 2005 года
Значительное пополнение корпуса со снятой грамматической омонимией, в котором теперь представлены также
нехудожественные жанры (газетные, журнальные статьи, мемуары, научно-технические, церковно-богословские
тексты; записи устной речи). Общий объём корпуса со снятой грамматической омонимией достиг 3,8 млн словоупотреблений
в 1000 документах. Эти тексты акцентуированы и доступны для лексико-семантического поиска.
19 апреля 2005 года
Реализована функция «расширение контекста». Пользователю, помимо выдаваемого по умолчанию
контекста длиной в одно предложение, доступен также расширенный контекст длиной в 7 предложений (по
3 предложения слева и справа).
7 апреля 2005 года
Значительное пополнение корпуса с неснятой грамматической омонимией. Добавлены и проиндексированы тексты общим
объемом 15 млн словоупотреблений: художественная литература XIX —
первой половины XX века; художественная литература 1960 — 1970-х гг.
(включая фантастику и детскую литературу); учебно-научные тексты, специальные и региональные журналы
и газеты 1990 — 2000-х гг., массовая литература (детективы, любовные романы)
этого же периода. Общий объём корпуса превысил 50 млн словоупотреблений.
10 марта 2005 года
Доступна версия для сохранения/печати (в том числе вариант со снятием ударений в акцентуированных
текстах). В выдаче указывается количество не только документов, но и контекстов (если найдено слишком
много, то число контекстов оценивается приблизительно).
18 октября 2004 года
Расширены возможности лексико-грамматического поиска в корпусе. Доступна экспериментальная система
поиска по семантическим и словообразовательным характеристикам лексем (семантическая неоднозначность
в настоящее время не снята).
Пополнение корпуса с неснятой грамматической омонимией. Добавлены и проиндексированы тексты общим объемом
3 млн словоупотреблений: пресса (центральная и региональная), научные издания, художественная
литература, мемуары, стенограммы устной речи.
Доступна страница статистики корпуса.
Внимание: несколько изменен язык запросов. Логическое «ИЛИ» задается при помощи
знака |, логическое«И» при помощи пробела или &
(см. подробнее)
16 июля 2004 года
Значительное пополнение корпуса с неснятой грамматической омонимией. Добавлены и проиндексированы
тексты общим объемом 11 млн словоупотреблений: художественная литература
(в том числе
произведения В. Астафьева, Г. Бакланова, Ю. Давыдова, В. Шукшина), мемуары
(в том числе
М. Цветаевой, А. Мариенгофа, Н. Гершензон-Чегодаевой), церковно-богословские тексты.
27 апреля 2004 года
По адресу http://ruscorpora.ru открыт сайт «Национального корпуса
русского языка». Поддержка сайта и поиск по корпусу осуществляется компанией
«Яндекс».
|