Корпус
  • 2014 текстов
  • 599 258 слов
мультимедийный, устный, омонимия снята
Корпус: Диалектный
Корпус диалектных текстов

Диалектный корпус развивается с 2005 года. Он включает в себя записи диалектной речи из различных регионов России, включая как говоры раннего образования (Север, Центр, Запад, Юг), так и позднего (Поволжье, Северный Кавказ, Урал, Сибирь, Дальний Восток). Представлены как спонтанная речь и индивидуальные рассказы, так и фольклорные прозаические и поэтические тексты. Полностью сохранена морфологическая, синтаксическая и лексическая специфика текстов. Большая часть текстов представлена в фонологизированной записи с ударениями (для каждой словоформы размечена также ее нормализованная версия), меньшинство текстов дается в орфографии, приближенной к стандартной. В подкорпусе имеются специальные пометы для особенностей диалектной морфологии, в том числе явлений, отсутствующих в литературном языке, кроме того, толкованиями снабжаются чисто диалектные лексемы. Развернутая метаразметка учитывает фонетические особенности, встретившиеся в каждом тексте (вокализм и консонантизм), его датировку, жанровую характеристику, время и место событий, о которых идет речь, социологические сведения об информанте, данные об административной принадлежности населенного пункта, где сделана запись, а также сведения о диалектологе, предоставившим текст, и о предыдущих публикациях текста. Часть текстов сопровождается аудио- и видеозаписями. Ведётся работа по интеграции базы данных пунктов, охваченных корпусом, с цифровой базой данных Диалектологического атласа русского языка.

Публикации

Ознакомьтесь со списком научных публикаций о диалектном корпусе по ссылке: https://ruscorpora.ru/s/e9BmY. В разделе «‎Публикации»‎ используйте фильтры, чтобы найти другие типы публикаций о корпусе.

Создание корпуса

Работа по созданию корпуса русских диалектных текстов осуществлялась группой ИРЯ РАН, первоначально под руководством А. Б. Летучего, а с 2008 г. И. Б. Качинской, при поддержке проекта ОИФН РАН «Создание новых подкорпусов Национального корпуса» (руководитель В. А. Плунгян) и грантов: РФФИ № 06-04-03818в,  РГНФ № 09-04-12159в, РГНФ № 14-04-12012, 
РФФИ № 18-012-00557 (руководители: первых двух проектов В. М. Живов, затем Д. В. Сичинава и А. В. Малышева). Новый импульс развитию Диалектного корпуса придал проект Министерства образования и науки № 075-15-2020-793 (2020—2023)

Принципы разметки были разработаны А. Б. Летучим при участии В. С. Мальцевой и В. А. Плунгяна, а затем доработаны И. Б. Качинской при участии Е. В. Моисеевой и Д. В. Сичинавы. Программные средства для разметки корпуса (включая рабочее место администратора) разработаны Т. А. Архангельским, конвертацию форматов осуществляла А. В. Панасюк. Работу над разметкой текстов под руководством И. Б. Качинской вели А. Н. Антонова, С. А. Афанасьева, М. С. Картышева, М. С. Нестерова, М. В. Новикова (Гашнева), А. И. Рыко, М. Г. Соломатина и другие.

 

Разработчки Корпуса приносят благодарность

И. И. Исаеву, Л. Л. Касаткину и С. К. Пожарицкой за консультации по разработке принципов формата разметки и по отбору и представлению диалектных текстов,

Е. П. Багировой (Тюменский государственный университет), Т. Е. Баженовой (Волгоградский государственный педагогический университет), Е. Н. Бекасовой (Оренбургский государственный педагогический университет), С. М. Беляковой (Тюменский государственный университет), Е. В. Грудевой, Н. А. Волковой, Н. Г. Мельниковой (Миховой) (все — Череповецкий государственный университет), В. М. Грязновой (Северо-Кавказский федеральный университет), З. П. Здобновой (Башкирский государственный университет), Т. Ф. Зибровой (Самарский государственный университет), Е. В. Иванцовой (Томский государственный университет), И. И. Исаеву (Российский государственный гуманитарный университет), Л. Л. Касаткину и Р. Ф. Касаткиной (ИРЯ РАН), Р. И. Кудряшовой (Волгоградский государственный педагогический университет), С. К. Пожарицкой (МГУ), В. Е. Гольдину и О. Ю. Крючковой (Саратовский государственный университет), Т. В. Махрачевой (Тамбовский государственный университет), С. А. Мызникову (ИЛИ РАН), Е. А. Нефёдовой (МГУ им. М. В. Ломоносова), С. П. Праведникову (Курский государственный педагогический университет), И. И. Русиновой (Пермский государственный университет), А. И. Рыко (Санкт-Петербургский государственный университет), З. В. Сметаниной (Вятский государственный университет), Т. Б. Юмсуновой-Моррис (Орегонский университет), предоставившим для Корпуса диалектные тексты.

Обновлено 22.07.2024