Корпус диалектных текстов

Диалектный корпус развивается с 2005 года. Он включает в себя записи диалектной речи из различных регионов России, включая как говоры раннего образования (Север, Центр, Запад, Юг), так и позднего (Поволжье, Северный Кавказ, Урал, Сибирь, Дальний Восток). Представлены как спонтанная речь и индивидуальные рассказы, так и фольклорные прозаические и поэтические тексты. Полностью сохранена морфологическая, синтаксическая и лексическая специфика текстов. Большая часть текстов представлена в фонологизированной записи с ударениями (для каждой словоформы размечена также ее нормализованная версия), меньшинство текстов дается в орфографии, приближенной к стандартной. В подкорпусе имеются специальные пометы для особенностей диалектной морфологии, в том числе явлений, отсутствующих в литературном языке, кроме того, толкованиями снабжаются чисто диалектные лексемы. Развернутая метаразметка учитывает фонетические особенности, встретившиеся в каждом тексте (вокализм и консонантизм), его датировку, жанровую характеристику, время и место событий, о которых идет речь, социологические сведения об информанте, данные об административной принадлежности населенного пункта, где сделана запись, а также сведения о диалектологе, предоставившим текст, и о предыдущих публикациях текста. Часть текстов сопровождается аудио- и видеозаписями. Ведётся работа по интеграции базы данных пунктов, охваченных корпусом, с цифровой базой данных Диалектологического атласа русского языка.

Подробнее см.:

А. Б. Летучий. Диалектный корпус: состав и особенности разметки // Национальный корпус русского языка: 2006—2008. Новые результаты и перспективы. СПб.: Нестор-История, 2009, с. 114—128.

И. Б. Качинская, Д. В. Сичинава. Диалектный подкорпус сегодня // Труды Института русского языка им. В.В. Виноградова. 2015. № 6. С. 142—163.

 

 

Создание корпуса

Работа по созданию корпуса русских диалектных текстов осуществлялась группой ИРЯ РАН, первоначально под руководством А. Б. Летучего, а с 2008 г. И. Б. Качинской, при поддержке проекта ОИФН РАН «Создание новых подкорпусов Национального корпуса» (руководитель В. А. Плунгян) и грантов: РФФИ № 06-04-03818в,  РГНФ № 09-04-12159в, РГНФ № 14-04-12012, 
РФФИ № 18-012-00557 (руководители: первых двух проектов В. М. Живов, затем Д. В. Сичинава и А. В. Малышева). Новый импульс развитию Диалектного корпуса придал проект Министерства образования и науки № 075-15-2020-793 (2020—2022)

Принципы разметки были разработаны А. Б. Летучим при участии В. С. Мальцевой и В. А. Плунгяна, а затем доработаны И. Б. Качинской при участии Е. В. Моисеевой и Д. В. Сичинавы. Программные средства для разметки корпуса (включая рабочее место администратора) разработаны Т. А. Архангельским, конвертацию форматов осуществляла А. В. Панасюк. Работу над разметкой текстов под руководством И. Б. Качинской вели А. Н. Антонова, С. А. Афанасьева, М. С. Картышева, М. С. Нестерова, М. В. Новикова (Гашнева), А. И. Рыко, М. Г. Соломатина и другие.

 

Разработчки Корпуса приносят благодарность

И. И. Исаеву, Л. Л. Касаткину и С. К. Пожарицкой за консультации по разработке принципов формата разметки и по отбору и представлению диалектных текстов,

Е. П. Багировой (Тюменский государственный университет), Т. Е. Баженовой (Волгоградский государственный педагогический университет), Е. Н. Бекасовой (Оренбургский государственный педагогический университет), С. М. Беляковой (Тюменский государственный университет), Е. В. Грудевой, Н. А. Волковой, Н. Г. Мельниковой (Миховой) (все — Череповецкий государственный университет), В. М. Грязновой (Северо-Кавказский федеральный университет), З. П. Здобновой (Башкирский государственный университет), Т. Ф. Зибровой (Самарский государственный университет), Е. В. Иванцовой (Томский государственный университет), И. И. Исаеву (Российский государственный гуманитарный университет), Л. Л. Касаткину и Р. Ф. Касаткиной (ИРЯ РАН), Р. И. Кудряшовой (Волгоградский государственный педагогический университет), С. К. Пожарицкой (МГУ), В. Е. Гольдину и О. Ю. Крючковой (Саратовский государственный университет), Т. В. Махрачевой (Тамбовский государственный университет), С. А. Мызникову (ИЛИ РАН), Е. А. Нефёдовой (МГУ им. М. В. Ломоносова), С. П. Праведникову (Курский государственный педагогический университет), И. И. Русиновой (Пермский государственный университет), А. И. Рыко (Санкт-Петербургский государственный университет), З. В. Сметаниной (Вятский государственный университет), Т. Б. Юмсуновой-Моррис (Орегонский университет), предоставившим для Корпуса диалектные тексты.

Обновлено