|
English
Национальный корпус русского языка
На этом сайте помещен корпус современного русского языка объемом более 140 млн слов. Корпус русского языка — это информационно-справочная система,
основанная на собрании русских текстов в электронной форме.
Корпус предназначен для всех, кто интересуется самыми разными вопросами, связанными с русским
языком: профессиональных лингвистов, преподавателей языка, школьников и студентов, иностранцев,
изучающих русский язык.
Как пользоваться Корпусом (инструкция в формате PDF)
Подробнее о корпусе
Новости проекта
23 июля 2010 года
Пополнение и усовершенствование функциональности Корпуса:
- — проведена унификация разметки в основном корпусе со снятой омонимией
(вид и залог глагольной лексемы, формы причастий и деепричастий,
ударение частотных словоформ имён собственных и несловарных слов,
разбор имён собственных, сокращений, иностранных слов, ряд мелких исправлений);
- — пополнен основной корпус с неснятой омонимией:
художественные и публицистические тексты XIX – первой половины XX века,
мемуары второй половины XX века, научные тексты, научно-популярные и общественно-политические журналы 1950-1980-х годов,
газеты 1990-х годов, тексты электронной коммуникации,
официально-деловые тексты.
Объём основного корпуса достиг 176 млн словоупотреблений.
- — пополнен корпус поэтических текстов:
творчество поэтов XIX – начала XX в.
(материалы выпусков «Библиотеки поэта»:
«Поэты 1840-х гг.»,
«Поэты-петрашевцы»,
«Поэты 1860-х гг.»,
«Поэты 1880-1890-х гг.»;
авторские сборники поэтов: И. Мятлев, М. Михайлов,
Н. Щербина, П. Соловьева, А. Добролюбов, К. Бальмонт,
Ю. Балтрушайтис, Е. Дмитриева (Черубина де Габриак),
Л. Кобылинский (Эллис), А. Кондратьев, Б. Садовской,
Т. Щепкина-Куперник, А. Скалдин, С. Соловьев,
А. Тиняков, Вяч. Иванов, М. Волошин).
Объём поэтического корпуса достиг 5 млн словоупотреблений.
- — пополнен корпус параллельных текстов,
достигающий 9 млн словоупотреблений;
добавлены англо-русские (Э. Бронте, Дж. Голсуорси,
К. Льюис, К. Воннегут и др.)
и немецко-русские (Новалис, Й. фон Эйхендорф,
Г. Гессе, Г. Бёлль и др.) параллельные тексты.
Впервые доступны для поиска украинско-русский
и русско-украинский параллельные корпуса (500 тыс. словоупотреблений).
8 июля 2010 года
Доступна выдача в формате KWIC (key word in context) с выравниванием ключевых слов по центру. Чтобы включить этот режим, пройдите по ссылке «формат KWIC» или «настройки» в верхней части страницы выдачи.
15 июня 2010 года
Выложена новая версия глубоко аннотированного корпуса русских текстов СинТагРус.
4 июня 2010 года
Появилась форма для сообщения об ошибках в тексте.
Чтобы сообщить об ошибке в разметке слова или документа, выделите его мышкой и во всплывающем окне нажмите «Сообщить об ошибке».
Также на странице с результатами поиска появились ссылки на поиск в других корпусах.
3 февраля 2010 года
Доступен для поиска Корпус современной русской прессы (газеты и сообщения новостных интернет-агентств за период 2000—2008 гг) объёмом около 100 млн словоупотреблений. Тексты предоставлены компанией Corpus Technologies.
1 января 2010 года
В 2009 году вышли два сборника,
в которых принимал непосредственное участие коллектив разработчиков Корпуса:
- Национальный корпус русского языка: 2006—2008. Новые результаты и перспективы.
— СПб.: Нестор-История, 2009. — 502 с.
- Корпусные исследования по русской грамматике. — М., Пробел, 2009. — 516 с.
18 ноября 2009 года Национальный
корпус русского языка стал
обладателем специального приза конкурса
работников электронных средств массовой информации «За образцовое
владение русским языком в профессиональной деятельности»
18 ноября 2009 года На сайте
Института русского языка РАН размещены
словари, созданные на основе
Национального корпуса русского языка: грамматический словарь новых
слов русского языка, новый
частотный словарь русской лексики, словарь
сочетаемости слов со значением высокой степени, словарь глагольной
сочетаемости непредметных имён русского языка.
18 ноября 2009 года
Выложена новая версия глубоко аннотированного корпуса русских текстов СинТагРус.
По сравнению с предыдущей версией в корпус было добавлено 88 современных статей научно-популярной, экономической и общественно-политической тематики,
опубликованных в российской периодической печати в 2007-2008 гг. Попутно были исправлены замеченные ошибки.
В настоящий момент СинТагРус содержит 41187 аннотированных предложений.
2 ноября 2009 года Открыт образовательный портал
Национального корпуса русского языка.
2 ноября 2009 года Пополнение
поэтического корпуса (добавлены тексты ряда авторов XVIII – XIX в., включая сборники второстепенных поэтов 1790–1830-х годов
«Библиотеки поэта»). Доступен список авторов поэтического
корпуса с возможностью перехода на подкорпуса текстов каждого из них.
26 февраля 2009 года В основном корпусе доступны опции поиска
слов в составе идиоматических оборотов и вне
оборотов. Доступен также расширенный семантический поиск по первому/не первому
значению слова, а также в части контекстов, где разрешена
лексико-семантическая омонимия.
25 февраля 2009 года Пополнение
параллельного корпуса; добавлен немецко-русский корпус (доступен для
лексико-грамматического поиска в общей
форме параллельных корпусов).
12 января 2009 года Пополнение корпусов. Расширены устный корпус (объём достиг 7,8 млн слов), акцентологический корпус (объём достиг 4,45 млн слов).
25 декабря 2008 года Пополнение корпусов. Расширены основной корпус (тексты первой половины XX в. — объём достиг 40 млн слов, тексты XVIII в. — объём достиг 2,6 млн слов), поэтический корпус (объём достиг 3 млн слов).
Архив новостей
|