Д. О. Добровольский (Москва)

Лингвоспецифичная лексика в корпусах параллельных текстов

 

В каждом языке есть слова, обладающие уникальной семантикой (по крайней мере, на фоне других языков, попавших в поле зрение исследователя). Такие лингвоспецифичные слова представляют собой интересный материал и для собственно семантических исследований, и для других направлений, таких как лексикография, сопоставительная лексикология, теория перевода. В последнее время активно разрабатываются методы анализа лингвоспецифичной лексики, основанные на корпусных данных; ср. [Бунтман и др. 2014]. Цель таких методов – обеспечить эмпирически надежные результаты. Это направление исследований представляется наиболее перспективным, так как традиционный способ отнесения того или иного слова к лингвоспецифичной лексике основывался почти исключительно на интуиции исследователя.

Суть одного из методов, предложенных в [Бунтман и др. 2014] состоит в том, что для лексических единиц, потенциально относящихся к лингвоспецифичным, определяется число их переводных эквивалентов, после чего оценивается дисперсия. Подчеркивается, что этот метод применим только к тем лингвоспецифичным словам, которые относятся к категории безэквивалентной лексики, при том что существуют и лингвоспецифичные лексемы, не связанные с идеей безэквивалентности.

Определение понятия безэквивалентности само по себе достаточно проблематично. Какие единицы следует считать безэквивалентными? Только те, которые не имеют убедительных соответствий в двуязычных словарях? Иными словами, те, перевод которых на другие языки полностью зависит от контекста? Или те, которые вообще не могут быть адекватно переведены на другой язык даже с опорой на контекстные условия?

Исходя из этих соображений, мы не проводим жесткой границы между категориями лингвоспецифичности и безэквивалетности. Лексические единицы, характеризующиеся специфичной для данного языка конфигурацией семантических признаков, являются и безэквивалентными, по крайней мере с точки зрения системы языка.

Цель данного исследования состоит в тестировании предложенного метода на корпусном материале. В качестве эмпирических данных взяты контексты из русско-немецкого параллельного корпуса НКРЯ со словами скитаться и захолустье. Выбор этих двух слов мотивирован в первую очередь тем, что, как показано в [Пеньковский 2004], их семантика обнаруживает нетривиальный признак ‘большого масштаба’. Ср. *скитаться по квартире, *скитаться из угла в угол при норме бродить по квартире, слоняться из угла в угол или *скитаться целый час при норме скитаться годами. Ср. также *захолустье Москвы и узуально допустимое захолустье Европы. А.Б. Пеньковский рассматривал эти слова в другом теоретическом контексте. В центре его внимания находился вопрос диахронических изменений. В языке пушкинской эпохи «масштабный» компонент в семантике этих единиц еще не был закреплен. Таким образом, мы имеем дело с появлением новой семантической категории.

В данной работе нас интересует не столько динамика семантического развития последних полутора столетий, сколько специфичность конфигурации признаков, зафиксированной в этих словах. Возможно, лингвоспецифичными окажутся не только слова типа скитаться и захолустье, но и сами дистинктивные признаки ‘большого’ vs. ‘малого масштаба’. Понятно, что при решении этой задачи попутно будет рассматриваться и вопрос языковых изменений, тем более что анализируемые корпусные данные включают произведения русской классической литературы с немецкими переводами.

Полученные результаты подтверждают гипотезу о специфичном характере семантики слов скитаться и захолустье. И то и другое слово переводится на немецкий язык весьма различными способами (ср. скитаться – umherschweifen, sich herumtreiben, herumlaufen, streichen, ein Pilgerleben führen, hausen, vagabundieren, wandern, sich umhertreiben, umherirren; захолустье – Einöde, Provinz, Dickicht, entlegene Kreisstadt, Wüste, irgendein verlorener Posten), что свидетельствует об отсутствии стандартных системных соответствий.

 

Литература

Бунтман Н.В., Зализняк Анна A., Зацман И.M., Кружков М.Г., Лощилова Е.Ю., Сичинава Д.В. Информационные технологии корпусных исследований: принципы построения кросс-лингвистических баз данных // Информатика и ее применения. Т. 8, вып. 2, 2014. С. 98-110.

Пеньковский А.Б. О развитии скрытых семантических категорий русского языка (от Пушкина до наших дней) // Вопросы языкознания. 2004. № 1. С. 42-59.