Д.О. Добровольский

ИРЯ РАН, Москва

 

Использование корпусов текстов в двуязычной лексикографии

 

Аннотация

В статье рассматриваются возможности использования корпусов текстов (в том числе параллельных корпусов) для создания двуязычных словарей нового типа.

Ключевые слова: корпус текстов, параллельный корпус, двуязычная лексикография, немецко-русские словари, конструкции, фразеология, межъязыковая эквивалентность

 

1. Алексея Кретова я уже почти десять лет, с тех пор как началась наша совместная работа над созданием подкорпуса параллельных текстов в рамках Национального корпуса русского языка (НКРЯ). Вполне понятно, что моя статья для этого сборника так или иначе должна быть связана с корпусами, в том числе с корпусами параллельных текстов. Поскольку я интересуюсь словарным описанием лексики и участвую в ряде лексикографических проектов (в том числе и двуязычных), для меня особенно важно выяснить какие дополнительные возможности открывает использование корпусов с этой точки зрения.

2. Совершенно очевидно, что параллельные корпусы позволяют обнаружить намного больше возможных переводных эквивалентов описываемой лексической единицы, чем анализ словарей и интроспекция. Приведем один пример. Немецкая фокусирующая частица eben, в отличие от синонимичной частицы gerade, может употребляться в качестве самостоятельного высказывания, что отмечается некоторыми современными словарями. Ср. фрагмент соответствующей словарной статьи в НБНС (в принятой в данном словаре системе грамматических категорий такие употребления выделяются в самостоятельную часть речи и маркируются как stzq, то есть Satzäquivalent “эквивалент предложения”).

eben II <…> II stzq вот то-то и оно, вот именно; – Morgen hat Oma Geburtstag, aber wir haben noch immer kein Geschenk! – Eben (~)! – Завтра у бабушки день рождения, а у нас всё ещё нет подарка! – Вот то-то и оно!

Это, казалось бы, достаточно полное описание фиксирует, тем не менее, далеко не все возможные способы передать данный смысл средствами русского языка, что становится очевидным при обращении к корпусам параллельных текстов. Анализ произведений лишь одного автора, из представленных в параллельном корпусе, показывает, что, помимо «словарных эквивалентов» вот то-то и оно, вот именно, существуют, по крайней мере, еще три способа перевода eben на русский язык; ср. (1-3).

(1)       „Meine Pflicht ist es, dich zu verhaften“, erklärte der Kommandant. „Eben.“

       – Мой долг велит мне арестовать тебя. – Вот и действуй. (Friedrich Dürrenmatt. Justiz. Пер.: В. Герасимов)

(2)       „Nur das“, sagte sie bestimmt. „Eben...“

       – Да, и больше ничего, – сказала она уверенно. – В том-то и дело. (Friedrich Dürrenmatt. Justiz. Пер.: В. Герасимов)

(3)       „Die eine These behauptet, daß zwischen Emmenberger und Nehle keine Beziehung bestehe, und ist wahrscheinlich, die zweite setzt eine Beziehung und ist unwahrscheinlicher.“ „Eben“, unterbrach Hungertobel den Alten, das habe er immer gesagt.

       – Первое положение утверждает, что между Неле и Эменбергером не существовало никаких отношений, оно вероятно; второе допускает эти отношения, и менее вероятно. – Вот это я и говорю все время, – прервал Хунгертобель старика. (Friedrich Dürrenmatt. Der Verdacht. Пер.: Н. Савинков)

 

Из сказанного вовсе не следует, что все способы перевода, встречающиеся в текстах, нужно помещать в словарь. В этом смысле полезно проводить различия между системной эквивалентностью и эквивалентностью текстовой, на что, в частности, указывают С. Лубенская и М. Мак Шейн: “<…> separate widely applicable equivalents from context-specific translations. It will also permit the elimination of lapses, occasionally made even by professional translators. <…> responding to the specificity of context, translators may replace one artistic image with another, use a stylistic device that is different from the original, or make up for a loss of a detail in another part of the context. Consequently, such translations would not illustrate the equivalents selected by the compilers. <…> there should be a place in a dictionary entry for creative context-specific translations.” (Lubensky, McShane 2007: 925-927).

Таким образом, обращение к параллельным корпусам помогает лексикографам не в том смысле, что любые обнаруженные в текстах эквиваленты следует включать в словари. Лексикографическая значимость параллельных корпусов проявляется скорее в том, что такие эквиваленты расширяют наши представления об устройстве лексических систем сопоставляемых языков, о влиянии контекстных условий на выбор наиболее адекватного эквивалента и помогают выявить лингвоспецифические особенности функционирования соответствующих лексических единиц. Особенно это хорошо видно на примерах таких единиц и конструкций, которые практически не учитываются словарями. В таких случаях обращение к корпусам помогает нащупать направление поиска возможных словарных эквивалентов.

3. Интересной с этой точки зрения оказывается немецкая конструкция vor sich hin, рассматриваемая нами в ряде предыдущих публикаций; см. (Добровольский, Падучева 2008; Dobrovol’skij 2010; 2012) Подобные устойчивые словосочетания с неаддитивной семантикой исследуются сегодня не только в рамках Грамматики конструкций, но и в рамках современной теории фразеологии, где, помимо «классических» типов фразем, выделяются грамматические фразеологизмы и фразеологизмы-конструкции, называемые также синтаксическими фразеологизмами (Баранов, Добровольский 2008: 67).

Имеющиеся в НКРЯ корпус немецких текстов с их русскими переводами показывает, что у этой конструкции обнаруживаются весьма различные, не синонимичные друг с другом эквиваленты. Такие, например, как перед собой (4), про себя (5), тихо (6), себе под нос (7).

(4)       „Messen Sie dem Lachen nicht zuviel Bedeutung zu“, sagte das Mädchen zu K., der, wieder traurig geworden, vor sich hin starrte und keine Erklärung zu brauchen schien, „dieser Herr – ich darf Sie doch vorstellen?“

– И пожалуйста, не придавайте слишком много значения нашему смеху, – обратилась она к К., видя, что тот опять помрачнел и уставился перед собой, не интересуясь никакими объяснениями, – этот господин – вы разрешите вас представить? (Franz Kafka. Der Prozess. Пер.: Р. Райт-Ковалева)

(5)       Was, o Siddhartha, was würde dann aus alledem werden, was auf Erden heilig, was wertvoll, was ehrwürdig ist? Und Govinda murmelte einen Vers vor sich hin, einen Vers aus einer Upanishad <…>.

Что же, Сиддхартха, станется со всем, что на земле почитается священным, ценным, достойным уважения? И Говинда тихо, про себя, проговорил стих из Упанишад  <…>. (Hermann Hesse. Siddhartha. Пер.: Б.Д. Прозоровская)

(6)       „Ich weiß“, sagte Gregor vor sich hin; aber so laut, daß es die Schwester hätte hören können, wagte er die Stimme nicht zu erheben.

– Я знаю, – сказал Грегор тихо; повысить голос настолько, чтобы его услыхала сестра, он не отважился. (Franz Kafka. Die Verwandlung. Пер.: С. Апт)

(7)       Pünktchen sauste die Treppe hinunter, stieg zu Herrn Hollack ins Auto und fuhr nach Hause. Während der ganzen Fahrt wippte sie auf dem Sitzpolster und sang vor sich hin.

Кнопка вихрем понеслась вниз по лестнице, вскочила в машину, и они поехали домой. Всю дорогу она подпрыгивала на мягком сидении и напевала себе под нос. (Erich Kästner. Pünktchen und Anton. Пер.: Е. Вильмонт)

 

Такое разнообразие переводов этой немецкой фраземы объясняется не только и не столько индивидуальными предпочтениями переводчика, сколько особенностями сочетаемости этой формы. Способы перевода фраземы vor sich hin диктуются в первую очередь семантикой глаголов, которые могут сочетаться с этой конструкцией. Иными словами, речь идет не об адвербиальной конструкции vor sich hin, которая, судя по всему, обладает настолько богатой и подвижной семантикой, что не поддается однозначному истолкованию, а о глагольной конструкции [vor sich hin + V], которая – из-за наличия глагола того или иного типа – конкретизирована по определенной семантической оси.

В сочетаниях с глаголами направленного визуального восприятия типа blicken, schauen, sehen, glotzen, stieren, starren стандартным переводом конструкции vor sich hin оказывается выражение перед собой. При этом данная идея может выражаться и другими средствами: как с помощью уточняющих модификаций предложной группы перед собой (8), так и с использованием квазисинонимичных выражений, например, уставившись в одну точку (9).

(8)       Einzelne freilich saßen, den Kopf in die Hände gestützt, am Tische und starrten vor sich hin.

Правда, кое-кто сидел, подперев голову руками, глядя перед собой невидящим взором. (Thomas Mann. Der Zauberberg. Пер.: В. Станевич)

(9)       „Lieber beiß ich mir die Zunge ab“, sagte Anton. Pünktchen verstand das nicht. Dann wandte sie sich zu Fräulein Andacht. Die saß in ihrer Ecke und stierte vor sich hin.

– Да я лучше себе язык откушу, – заявил Антон. Кнопка не поняла его. Она повернулась к фройляйн Андахт. Гувернантка сидела в своем углу, уставившись в одну точку. (Erich Kästner. Pünktchen und Anton. Пер.: Е. Вильмонт)

 

В сочетаниях с глаголами, обладающих неким коммуникативным потенциалом, переводы также варьируют в довольно широком диапазоне. Здесь имеются в виду прежде всего «классические» глаголы говорения, такие как sprechen, murmeln, nuscheln, lallen, brabbeln, fluchen, schimpfen, но также и глаголы «пения» типа singen, summen и шире – глаголы со значением физического действия, передающего некоторое внутреннее состояние; ср. kichern, grinsen, gähnen; lachen, weinen, heulen. Причем в норме эти действия фиксируются окружающими, так что само действие обладает коммуникативным потенциалом: зевая, смеясь, напевая, мы сообщаем прочим участникам ситуации какую-то информацию о собственном внутреннем состоянии. В этом случае основная функция конструкции vor sich hin – это «зачеркивание» идеи направленности вовне. Сочетаясь с этими глаголами, vor sich hin ослабляет или даже аннулирует их коммуникативный потенциал, превращает их в обозначения квази-аутичных реакций. Еще один характерный семантический признак – это ‘слабая интенсивность’. Наличие этих признаков хорошо прослеживается при обращении к русским эквивалентам, ср. примеры (5-7) выше. Признак интровертивности (= ‘для себя, а не для других’) передается русскими выражениями про себя, себе под нос. А признак слабой интенсивности – наречием тихо, а также с помощью морфологической на-(ы)ва-деривации; ср. свистеть vs. насвистывать или петь vs. напевать из примера (7). Иногда соответствующие признаки оказываются встроенными  в семантику глагола и никак эксплицитно не выражаются в русском переводе. Ср. глаголы пробурчать и пробормотать в примерах (10) и (11).

(10)     Charousek blickte ebenfalls einen Augenblick zurück und brummte etwas vor sich hin.

Харусек тоже бросил взгляд назад и что-то пробурчал. (Gustav Meyrink. Der Golem. Пер.: Д.Л. Выгодский)

(11)     Die Sphinx murmelte unvernehmlich vor sich hin, und rauschte mit den Flügeln.

Сфинкс пробормотал что-то невнятное и зашелестел крыльями. (Novalis. Heinrich von Ofterdingen. Пер.: В. Микушевич, З. Вергерова, С. Ошеров)

 

Возможности передачи средствами русского языка семантики фраземы vor sich hin в составе конструкции с «коммуникативными» глаголами не исчерпывается указанными выше способами. Ср. контексты а также (12-14).

(12)     Doktor Grabow lächelte vor sich hin, mit einem nachsichtigen und beinahe etwas schwermütigen Lächeln.

Доктор Грабов усмехнулся снисходительно, почти скорбной усмешкой. (Thoms Mann. Buddenbrooks. Пер.: Н. Ман)

(13)     Ich steckte mir die drittletzte Zigarette an, nahm die Guitarre wieder hoch und klimperte ein bißchen vor mich hin.

Я закурил – и теперь у меня осталось всего две сигареты, опять взял гитару и стал бренчать. (Heinrich Böll. Ansichten eines Clowns. Пер.: Р. Райт-Ковалева)

(14)     Ich sang auch jetzt leise vor mich hin und merkte erst im Singen, daß es Verse waren.

Я и в этот раз тихонько запел и лишь спустя некоторое время заметил, что это стихи. (Hermann Hesse. Peter Camenzind. Пер.: Р. Эйвадис)

 

Так, в глаголе усмехнуться (12) фиксирована идея слабой интенсивности и некоторой интровертивности: в нормальном случае усмешка не предназначена для сообщения окружающим информации об эмоциональном или ментальном состоянии субъекта. Сходными характеристиками обладает глагол бренчать (на гитаре) (13), в отличие от глагола играть (на гитаре), который обычно предполагает наличие слушателей. А в некоторых случаях та часть смысла высказывания, которая выражается в немецком оригинале с помощью vor sich hin, остается вообще не выраженной в русском переводе (14), что, однако, до определенной степени компенсируется контекстом (ср. в данном случае leise – тихонько).

Помимо проанализированных здесь, существует еще целый ряд глагольных конструкций с участием фраземы vor sich hin. Сюда относится, во-первых, сочетание этой фраземы с глаголами, обозначающими неактивные, неконтролируемые состояния живых организмов, как правило, людей, а также соответствующие вялотекущие, большей частью неконтролируемые процессы; ср. vegetieren, welken, dösen, kränkeln, siechen, dämmern, schlummern, leiden. Семантический вклад конструкции vor sich hin состоит здесь прежде всего в усилении идеи длительности, неактивности и слабой контролируемости. Так, глагол dösen ‘дремать’ и сам по себе обозначает пассивное состояние. Vor sich hin подчеркивает, что субъект находится в состоянии, исключающем активную деятельность и контроль (как над ситуацией, так и над собственным состоянием), а также продолжительность этого состояния. По этим причинам сочетание конструкции vor sich hin с глаголами типа (ii) часто дает выражения с отрицательной оценкой. Если сам по себе глагол dösen может быть переведен, например, как клевать носом, то vor sich hin dösen – это скорее пребывать в состоянии сонной апатии.

Во-вторых, это сочетания с некоторыми ментальными глаголами и глаголами, обозначающими внутренние состояния; ср. denken, überlegen, sinnieren, träumen, brüten. На вопрос, в чем состоит семантический вклад в высказывание конструкции vor sich hin, не так просто найти удовлетворительный ответ. Понятно, что это не может быть идея инровертивности, направленности «в себя», как в сочетаниях с «коммуникативными» глаголами, поскольку глаголы со значением ‘думать’, ‘мечтать’, ‘размышлять’ и т.п. и так обозначают виды ментальной деятельности и внутренние состояния, которые, по определению, не могут быть обращены вовне. Также и шкала активности-пассивности или степени контролируемости плохо применима к внутренним состояниям. Отрицательная оценка сочетаниям этой группы также не свойственна. По-видимому, то новое, что вносит vor sich hin в высказывание – это идея игнорирования окружающего мира, полной погруженности в себя, а также относительной длительности соответствующего состояния. Идея отказа от каких бы то ни было контактов с внешним миром хорошо видна в русских переводах подобных сочетаний; ср. (15).

(15)     Dann setzte ich mich in meinen Stuhl und brüte vor mich hin.

            Потом усаживаюсь в свое кресло и погружаюсь в мрачную задумчивость. (Erich Maria Remarque. Der schwarze Obelisk. Пер.: В. Станевич)

 

В-третьих, встречаются сочетания vor sich hin с глаголами, относящимися к неодушевленным сущностям и обозначающие вялотекущие, большей частью неконтролируемые процессы, а также соответствующие состояния; ср. tröpfeln, köcheln, brennen, glimmen, dümpeln, gären, rosten, modern, plätschern, krieseln, gammeln. Такие процессы часто оцениваются как ведущие к ухудшению состояния субъекта, то есть эта глагольная группа часто обладает признаком ‘отрицательная оценка’. Причем этот признак может как уже содержаться в семантике глагола (ср. modern, dämmern, gammeln), так и привноситься конструкцией vor sich hin. Дальнейшие характерные признаки – это ‘дуративность’, ‘неконтролируемость извне’ и ‘слабая интенсивность’. Относительно межъязыковой эквивалентности данная глагольная конструкция обнаруживает интересную особенность. Ее наиболее типичным русским эквивалентом оказывается конструкция [V + себе]; ср. кипит себе, коптит себе, дымит себе, ржавеет себе, чахнет себе. Частица себе берет на себя выражение дуративности, слабой интенсивности и неконтролируемости, то есть показывает, что речь идет о длительных, вялотекущих процессах, протекающих без вмешательства извне и не в соответствии с целями некой активной инстанции.

Выделяются еще два типа сочетаний vor sich hin: это конструкции с глаголами, обозначающими виды деятельности; например: arbeiten, sortieren, dilletieren, essen, regieren, suchen, и с глаголами движения; ср. gehen, tanzen, taumeln, hüpfen, fahren, tappen и пр. Здесь эти типы сочетаний обсуждаться не будут. Заметим лишь, что данные конструкции встречаются в корпусах существенно реже, чем рассмотренные выше. С семантической точки зрения они обнаруживают свои собственные конфигурации выделенных признаков; см. подробнее (Dobrovol’skij 2011).

Какие из эквивалентов, обнаруженных в корпусах, следует включать в словарь – это отдельная проблема. Важно, что выделенные глагольные конструкции с участием vor sich hin удалось найти только благодаря корпусам. Важно также, что именно эти конструкции, а не адвербиальная фразема vor sich hin, являются единицами лексикографического описания, по крайней мере в двуязычных словарях. В зависимости от семантического класса глагола каждая из таких конструкций коррелирует с особым типом русских выражений.

4. Еще один продуктивная область использования корпусов текстов для двуязычной лексикографии – это словари идиом. В течение последних семи лет мы с коллегами предпринимаем усилия по созданию нового немецко-русского фразеологического словаря, в основе которого лежат данные корпусов. Это в первую очередь корпус DeReKo, но в отдельных случаях также и DWDS. Некоторые примеры употребления заимствуются из немецкоязычного Интернета. Необходимость такого словаря мотивирована тем, что существующие немецко-русские фразеологические словари не удовлетворяют современным требованиям. Используются и немецко-русские параллельные тексты НКРЯ. Отдельные статьи этого словаря представлены в открытом доступе на сайте Института немецкого языка в Мангейме под рабочим названием „Deutsch-russische Idiome online“ (http://wvonline.ids-mannheim.de/idiome_russ/index.htm).

Использование аутентичных примеров на основе корпусов текстов – новый прием в двуязычной фразеографии. Традиционные словари строились, как известно, на ограниченном массиве примеров, причем примеров, как правило, случайных. Часто употребление фразеологизмов вообще оставалась не проиллюстрированным. Преимущества использования корпусов состоят не только в более подробной и продуманной экземплификации описываемых выражений, но и в тех дополнительных возможностях, которые корпусный материал предоставляет для формирования словника и построения словарной статьи.

 

Литература

Баранов А.Н., Добровольский Д.О. (2008). Аспекты теории фразеологии. М.: Знак, 2008.

Гурина Е.Е., Добровольский Д.О., Кретов А.А. (2005). Асимметрия членения текста в параллельном корпусе (на материале романа Т. Драйзера «Сестра Кэрри») // Вестник Воронежского гос. университета. Серия «Лингвистика и межкультурная коммуникация», 2005, № 1, 67-74.

Добровольский Д.О. (2010). Что значит немецкая конструкция vor sich hin? // Язык. Закономерности развития и функционирования: Сб. к юбилею Н.Н. Семенюк. – М., Калуга: Эйдос, 2010, 286-296.

Добровольский Д.О., Кретов А.А., Шаров С. (2005а). Корпус параллельных текстов // НТИ сер.2, 2005, N 6, 16-27.

Добровольский Д.О., Кретов А.А., Шаров С. (2005б). Корпус параллельных текстов: архитектура и возможности использования // Национальный корпус русского языка: 2003-2005. Результаты и перспективы. М.: Индрик, 2005, 263-296.

Добровольский Д.О., Падучева Е.В. Дейксис в отсутствие говорящего: о семантике немецких дейктических элементов hin и her // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог». Выпуск 7 (14). – М.: РГГУ, 2008, 140-146.

НБНС – Новый большой немецко-русский словарь. В 3 т.: около 500 000 лексических единиц / под общим руководством Д.О. Добровольского. М.: АСТ: Астрель, 2008-2010.

Dobrovol’skij D. (2010). Deiktische Konstruktionen des Deutschen aus lexikographischer Perspektive // Proceedings of the XIV Euralex International Congress, Leeuwarden, 6-10 July 2010. CD-ROM. – Leeuwarden: Fryske Akademy.

Dobrovol’skij D. (2011). Phraseologie und Konstruktionsgrammatik // Konstruktionsgrammatik III. Aktuelle Fragen und Lösungsansätze, Tübingen: Stauffenburg, 2011, 111-130.

Dobrovol’skij D. (2012). Phrasem-Konstruktionen in Parallelcorpora // Idiome, Konstruktionen, "verblümte rede". Beiträge zur Geschichte der germanistischen Phraseologieforschung. Stuttgart: Hirzel, 2012, 327-340.

Lubensky S., McShane M. (2007). Bilingual phraseological dictionaries // Phraseology: an international handbook of contemporary research. Vol. 2. Berlin, New York: de Gruyter, 2007, 919-928.

Taylor J.R. (2006). Polysemy and the lexicon // Cognitive linguistics: current approaches and future perspectives. Berlin, New York: Mouton de Gruyter, 2006, 51-80.

 

Текстовые источники

НКРЯ – Корпус немецко-русских параллельных текстов Национального корпуса русского языка: http://www.ruscorpora.ru/search-para.html

DeReKo – Das Deutsche Referenzkorpus des IDS Mannheim im Portal COSMAS II (Corpus Search, Management and Analysis System): https://cosmas2.ids-mannheim.de/cosmas2-web

DWDS – Corpora des Digitalen Wörterbuchs der deutschen Sprache des 20. Jahrhunderts: http://www.dwds.de