русска€ верси€

Semantics

Representation of lexical and semantic information

Currently, the Corpus facilitates searches for lexical and semantic characteristics of words as the texts are semantically tagged.

Most words in a text are tagged with a number of semantic and derivational parameters such as УpersonФ, УsubstanceФ, УspaceФ, УmovementФ, УdiminutiveФ, Уverbal nounФ, etc. It is possible for a word to be assigned characteristics along several different parameters. The texts are tagged by the Semmarkup program (by A. E. Poliakov) which uses the Semantic dictionary of the Corpus. Semantic homonymy is not disambiguated because such a process would have to be done by hand and would be extremely time-consuming; homonyms are assigned multiple semantic analyses. The semantic tagging is based on the classification system which was developed for the database Lexicograph beginning from 1992 under the leadership of E. V. Paducheva and E. V. Rakhilina at the Department of Linguistic Research at the All-Russian Institute of Scientific and Technical Information of the Russian Academy of Sciences. Since then the dictionary was essentially expanded, several new semantic classes and the derivational parameters were added for the needs of the Corpus.

The Semantic dictionary is based on the morphological dictionary of the DIALING system (120 thousand words) which in its turn is an expansion of the ZalizniakТs Grammatical dictionary of Russian .

The structure of semantic and lexical information

There are three groups of tags assigned to words to reflect lexical and semantic information:

  1. Class (a name, a reflexive pronoun, etc.)
  2. Lexical and semantic features (a lexeme's thematic class, indications of causality or assessment, etc.)
  3. Derivational features (a diminutive, an adjectival adverb, etc.)

The set of semantic and lexical parameters is different for different parts of speech. Moreover, nouns are divided into three subclasses (concrete nouns, abstract nouns, and proper names), each with its own hierarchy of tags.

Lexical and semantic tags are grouped as follows:

  1. Taxonomy (a lexeme's thematic class) Ц for nouns, verbs, adjectives and adverbs.
  2. Mereology (Уpart Ц wholeФ and Уelement Ц aggregateФ relationships) Ц for concrete and abstract nouns
  3. Topology Ц for concrete names
  4. Causation Ц for verbs
  5. Auxiliary status Ц for verbs
  6. Evaluation Ц for abstract and concrete nouns, adjectives and adverbs

A word in the semantic dictionary is assigned a set of characteristics along the following parameters:

Х taxonomic class; for example: СpersonsТ, СspacesТ, СtextsТ (for nouns); СmotionТ, СlocationТ, СemotionТ (for verbs); СspeedТ, СdurationТ, СplaceТ (for adjectives and adverbs);

Х mereological class (for nouns): СpartsТ, СsetsТ etc.;

Х topological class (for nouns): СcontainersТ, Сhorizontal surfacesТ, etc.;

Х causative / non-causative (for verbs);

Х positive and negative evaluation (for all parts of speech);

Х derivational features.

  1. Morpho-semantic features, for example: diminutive, caritive, semelfactive, etc.;
  2. Class of the motivating word, for example: verbal noun, adjectival adverb;
  3. Taxonomic type of the motivating word, for example: adverb derived from adjective of size;
  4. Morphological type of derivation (substantivization, compound word, etc.)

The meta-language of tags is based on English notation; it is, however, possible to make a search using traditional Russian category names in the Уsemantic featuresФ form. The following is an inventory of all currently available tags with examples in parenthesis.

Nouns (S)

Categories

r:concr Ч concrete nouns (девочка, стол, молоко)

r:abstr Ч abstract nouns (вождение, €ркость, врем€)

r:propn Ч proper names (»ван, Ёйнштейн, ѕетроград)

Concrete nouns

Taxonomy

t:hum Ч person (человек, учитель)

t:hum:etn Ч ethnonyms (эфиоп, италь€нка)

t:hum:kin Ч kinship terms (брат, бабушка)

t:hum:supernat Ч supernatural creatures (русалка, инопланет€нин)

t:animal Ч animals (корова, жираф, сорока, €щерица, муравей)

t:plant Ч plants (береза, роза, трава)

t:stuff Ч substances and materials (вода, песок, тесто, жесть, шелк)

t:space Ч space and places (космос, город, тайга, овраг, вход)

t:constr Ч buildings and constructions (дом, шалаш, мост)

t:tool Ч tools and appliances (молоток, палка, пуговица, машина)

t:tool:instr Ч tools (штопор, игла, карандаш)

t:tool:device Ч machinery and devices (телефон, се€лка, градусник)

t:tool:transp Ч vehicles (автобус, поезд, сани)

t:tool:weapon Ч weapons (сабл€, пистолет, гаубица)

t:tool:mus Ч musical instruments (ро€ль, скрипка, колокол)

t:tool:furn Ч furniture (стол, диван, шкаф)

t:tool:dish Ч kitchen utensils (чашка, кастрюл€, фл€жка)

t:tool:cloth Ч clothes and footwear (платье, шл€па, ботинки)

t:food Ч food and drinks (пирог, каша, молоко)

t:text Ч texts (рассказ, книга, афиша)

Mereology:

pt:part Ч parts (верхушка, кончик, половина)

pt:partb& pc:hum Ч human body parts and organs (голова, сердце, ноготь)

pt:partb& pc:animal Ч animal body parts and organs (хвост, жало)

pt:part& pc:plant Ч parts of plants (лист, ветка, корень)

pt:part& pc:constr Ч parts of buildings and constructions (комната, дверь, арка)

pt:part& pc:tool Ч parts of tools (деталь, лопасть, крышка)

pt:part& pc:tool:instr Ч parts of instruments (топорище, лезвие)

pt:part& pc:tool:device Ч parts of machinery and devices (дисплей, корпус, кнопка)

pt:part& pc:tool:transp Ч parts of vehicles (руль, колесо, капот)

pt:part& pc:tool:weapon Ч parts of weapons (дуло, курок, эфес)

pt:part& pc:tool:mus Ч parts of musical instruments (струна, гриф)

pt:part& pc:tool:furn Ч parts of furniture (сиденье, подлокотник)

pt:part& pc:tool:dish Ч parts of kitchen utensils (носик, горлышко)

pt:part& pc:tool:cloth Ч parts of clothes and footwear (рукав, каблук)

pt:qtm Ч quanta and portions (капл€, комок, порци€)

pt:set/ pt:aggr Ч sets and aggregates (набор, букет, мебель, человечество)

hi:class Ч classes (животное, €года, инструмент)

Topology

top:contain Ч containers (кошелек, комната, озеро, ниша)

top:horiz Ч horizontal surfaces (пол, площадка)

Evaluation:

ev Ч evaluation (neither positive nor negative) (озорник, махина)

ev:posit Ч positive evaluation (умница, светило)

ev:neg Ч negative evaluation (негод€й, вертихвостка)

Derivational tags

d:dim Ч diminutives (зайчик, коробочка)

d:aug Ч augmentatives (детина, домище)

d:sing Ч singulatives (пылинка, изюминка)

d:nag Ч nomina agentis (писатель, создатель, докладчик)

d:fem Ч nomina feminina (немка, генеральша, до€рка)

Abstract nouns

Taxonomy

t:move Ч movement (беготн€, вынос, качка)

t:move:body Ч body movement (поклон)

t:put Ч placement of objects (размещение, расстановка, погрузка, намотка)

t:impact Ч physical impact (удар, втирание, обмолот)

t:impact:creat Ч creation of physical objects (лепка, отливка, плетение, сооружение, строительство)

t:impact:destr Ч destruction (слом, сожжение)

t:changest Ч change of state or features (укрепление, затвердение, осушение, конденсаци€, осложнение)

t:be Ч sphere of being

t:be:exist Ч existence (жизнь, наличие, бытие)

t:be:appear Ч start of existence (возникновение, рождение, формирование, учреждение, творение)

t:be:disapp Ч end of existence (смерть, казнь, ликвидаци€)

t:loc Ч location (местоположение)

t:loc:body Ч body location (лежание)

t:contact Ч contact and support (прикосновение, объ€тие)

t:poss Ч sphere of possession (обладание, приобретение, покупка, потер€, лишение)

t:ment Ч mental sphere (знание, абстракци€, воображение, воспоминание, догадка)

t:perc Ч perception (ос€зание, слух, видимость, взгл€д, зрелище)

t:psych Ч psychological states (апати€, безумие, вдохновение, спокойствие)

t:psych:emot Ч emotions (восторг, раска€ние, печаль)

t:psych:volit Ч volition (намерение, решение)

t:speech Ч speech (дискусси€, молва, ахине€, реплика, подковырка)

t:physiol Ч physiology (жажда, кровоизли€ние, судорога, утомление, икота)

t:weather Ч natural phenomena (зарница, вьюга, зной)

t:sound Ч sounds (шум, перезвон, хлопок, аплодисменты, диссонанс)

t:color Ч colours (окраска, колорит, желтизна, прозелень)

t:light Ч light (луч, полумрак, светлынь, иллюминаци€)

t:taste Ч taste (вкуснота, горчинка, кисл€тина)

t:smell Ч smells (аромат, перегар)

t:temper Ч temperature (прохлада, стужа, нагрев)

t:time Ч time (весна, годовщина, минута, современность)

t:time:period Ч period of time (межсезонье, путина, сенокос, стаж)

t:time:moment Ч moment of time (миг, мгновение)

t:time:week Ч day of week (понедельник)

t:time:month Ч month (€нварь)

t:time:age Ч age (детство, молодость, двадцатилетие)

t:humq Ч human qualities (пор€дочность, безволие, остроумие)

t:behav Ч human behaviour (разгильд€йство, подхалимаж, неповиновение, реб€чество, предательство)

t:inter Ч interaction and interrelation (взаимопомощь, вражда, схватка, драка)

t:action Ч social events (аукцион, вернисаж, вечеринка, выборы, именины, заседание, культпоход)

t:disease Ч diseases (ангина, диабет)

t:game Ч games (жмурки, покер, домино, волейбол)

t:sport Ч sport (спартакиада, акробатика, баскетбол)

t:param Ч parameters (высота, грузоподъемность)

t:unit Ч units of measurement (балл, килограмм, метр, минута)

Mereology

pt:part Ч part (начало, финал)

pt:qtm Ч quantum (оборот, прыжок, кивок)

pt:set Ч set (система, выборка, алгоритм)

Evaluation

ev Ч evaluation (озорник, махина)

ev:posit Ч positive evaluation (благоухание, загл€денье, изюминка)

ev:neg Ч negative evaluation (безвкусица, ахине€)

Derivational tags

der:v Ч verbal nouns (выбор, демонстраци€)

der:a Ч adjectival nouns (краснота, жадность)

Proper names

Taxonomy

t:hum| t:hum:supernat Ч people (Ћюдмила, „ерномор)

t:persn Ч personal names (јлександр)

t:patrn Ч patronymics (—ергеевич)

t:famn Ч surnames (ѕушкин)

t:topon Ч toponyms (≈вропа, ¬олга, Ёльбрус, ћосква, ѕреображенка)

Derivational tags

d:dim Ч diminutives (—аша, ∆енечка, Ќиколаич)

Adjectives (A)

Categories

r:qual Ч qualitative (хороший, большой)

r:rel Ч relative (дерев€нный, лунный)

r:poss Ч possessive (божий, отцов, мужнин)

r:invar Ч non-inflectable (беж, джерси)

Semantic tags

t:size Ч size (высокий, короткий)

t:size:max Ч large size (высокий, длинный)

t:size:min Ч small size (низкий, короткий)

t:size:abs Ч absolute size (двухэтажный)

t:dist Ч distance (далекий, соседний)

t:dist:max Ч long distance (дальний, отдаленный)

t:dist:min Ч short distance (близкий, недалекий)

t:quant Ч quantity (большой, достаточный, трехкратный)

t:quant:max Ч large quantity (обильный, многочисленный)

t:quant:min Ч small quantity (ничтожный, малочисленный)

t:quant:abs Ч absolute quantity (двухтыс€чный, восьмимилионный)

t:place Ч place (левый, придорожный, теменной)

t:dir Ч direction (обратный, подветренный)

t:time Ч time (прошлый, ночной)

t:time:dur Ч duration (долгий, краткий)

t:time:dur:max Ч long duration (долгий, продолжительный)

t:time:dur:min Ч short duration (краткий, кратковременный)

t:time:dur:abs Ч absolute duration (восьмичасовой)

t:time:age Ч age (зрелый)

t:time:age:max Ч old age (старый, древний)

t:time:age:min Ч young age (молодой, малолетний)

t:time:age:abs Ч absolute age (трехлетний)

t:speed Ч speed (проворный)

t:speed:max Ч high speed (скорый, быстрый)

t:speed:min Ч low speed (медленный, т€гучий)

t:physq Ч physical qualities (м€гкий, в€зкий)

t:physq:form Ч form (кривой, круглый)

t:physq:color Ч colour (красный, бесцветный)

t:physq:taste Ч taste (кислый, приторный)

t:physq:smell Ч smell (ароматный, тухлый)

t:physq:temper Ч temperature (гор€чий, лед€ной)

t:physq:weight Ч weight (т€желый, легкий)

t:humq Ч human qualities (умный, верный, ловкий)

Evaluation

ev Ч evaluation (толковый, мешковатый)

ev:posit Ч positive evaluation (везучий, ладный)

ev:neg Ч negative evaluation (продажный, сварливый)

Derivational tags

d:dim Ч diminutives (тихонький, крохотный)

d:aug Ч augmentatives (здоровенный, злющий)

d:atten Ч attenuatives (угловатый, жуликоватый)

d:habit Ч habitives (глазастый, пузатый)

d:carit Ч caritives (безглазый, бездыханный)

d:potent/ d:impot Ч potentials (плавучий, недееспособный)

d:potent Ч possibilitives (плавучий, плодородный, занимательный)

d:impot Ч impossibilitives (несоизмеримый, недееспособный)

der:s Ч denominal adjectives (домашний, железный)

der:v Ч derverbal adjectives (ковкий, нав€зчивый, кочевой)

der:adv Ч deadverbial adjectives (поздний, здешний)

Numerals (NUM, A-NUM)

Categories

r:card Ч cardinal (два, п€ть, дес€ть)

r:card:pauc Ч paucal numerals (два, три, четыре, оба, пол, полтора)

r:ord Ч ordinal (первый, второй, дес€тый)

Pronouns, including:

S-PRO Ч personal pronouns (он, кто)

A-PRO Ч adjectival pronouns (его, какой)

ADV-PRO Ч adverbial pronouns (где, как)

Categories

r:pers Ч personal (€, он)

r:ref Ч reflexive (себ€)

r:poss Ч possessive (мой, его, свой)

r:rel Ч interrogative/relative (кто, который, когда)

r:dem Ч demonstrative (этот, такой)

r:indet Ч indefinite (некоторый, некогда)

r:neg Ч negative (никакой, ничей)

r:spec Ч quantifiers (вс€кий, каждый, любой)

Verbs (V)

Semantic tags

t:move Ч movement (бежать, дергатьс€, бросить, нести)

t:move:body Ч spatial configuration (согнуть, нагнутьс€, примоститьс€)

t:put Ч placement (положить, вложить, спр€тать)

t:impact Ч physical impact (бить, колоть, вытирать)

t:impact:creat Ч creation of a physical object (выковать, смастерить, сшить)

t:impact:destr Ч destruction of a physical object (взорвать, сжечь, зарезать)

t:changest Ч change of state or property (взрослеть, богатеть, расширить, испачкать)

t:be Ч sphere of existence (жить, возникнуть, убить)

t:be:exist Ч existence (жить, происходить)

t:be:appear Ч start of existence (возникнуть, родитьс€, сформировать, создать)

t:be:disapp Ч end of existence (умереть, убить, улетучитьс€, ликвидировать, искоренить)

t:loc Ч location (лежать, сто€ть, положить)

t:loc:body Ч spatial configuration сидеть)

t:contact Ч contact and support (касатьс€, обнимать, облокотитьс€)

t:poss Ч sphere of possession (иметь дать, подарить, приобрести, лишитьс€)

t:ment Ч mental sphere (знать, верить, догадатьс€, помнить, считать)

t:perc Ч perception (смотреть, слышать, нюхать, чу€ть)

t:psych Ч psychological sphere (гипнотизировать, сочувствовать, настроитьс€, терпеть)

t:psych:emot Ч emotion (радоватьс€, обидеть)

t:psych:volit Ч volition (решить)

t:speech Ч speech (говорить, советовать, спорить, каламбурить)

t:behav Ч human behaviour (куролесить, привередничать)

t:physiol Ч sphere of physiology (кашл€ть, икать)

t:weather Ч natural phenomena (бушевать, вьюжить)

t:sound Ч sounds (гудеть, шелестеть)

t:light Ч light (гаснуть, лучитьс€)

t:smell Ч smell (пахнуть, благоухать)

Auxiliary verbs

aux:phase Ч phasal verbs (начать, продолжать, прекратить)

aux:caus Чverbs of causation (вызвать, привести <к>)

Causativity

ca:caus Ч causative verbs (показать, вертеть)

ca:noncaus Ч non-causative verbs (видеть, вертетьс€)

Derivational tags

d:pref Ч prefixal verb (забегать, огл€деть)

d:semelf Ч semelfactive (кивнуть, чихнуть, боднуть, качнутьс€)

d:impf Ч secondary imperfectives (with -ива-, -ва-, -а-) (выпивать, вбивать, прогон€ть)

Adverbs (ADV)

Semantic tags

t:place Ч place (здесь, посередине)

t:dir Ч direction (туда, наверх)

t:dist Ч distance (далеко, близко)

t:dist:max Ч long distance (далеко, вдали, вдалеке)

t:dist:min Ч short distance (близко, вблизи)

t:time Ч time (тогда, поздно)

t:time:dur Ч duration (вечно, недолго)

t:time:dur:max Ч long duration (вечно, подолгу, всегда)

t:time:dur:min Ч short duration (временно, недолго)

t:speed Ч speed (быстро, медленно)

t:speed:max Ч fast (быстро, мигом)

t:speed:min Ч slow (медленно, неторопливо)

t:quant Ч quantity (столько, достаточно)

t:quant:max Ч large quantity (много, навалом)

t:quant:min Ч small quantity (мало, чуть-чуть)

Evaluation

ev Ч evaluation (беспечно, бойко)

ev:posit Ч positive evaluation (бойко, безупречно)

ev:neg Ч negative (бездарно, неловко)

Derivational tags

d:dim Ч diminutive (немножко, быстренько)

d:atten Ч attenuative (рановато, суховато)

der:s Ч denominal adverbs (вверху, дома)

der:v Ч deverbal adverbs (отрод€сь, стойм€)

der:a Ч deadjectival adverbs (быстро, обычно)

Taxonomy of motivating adjectives

der:a& dt:size Ч size (высоко, коротко)

der:a& dt:size:max Ч large size (высоко, бесконечно)

der:a& dt:size:min Ч small size (коротко, низко)

der:a& dt:physq Ч physical qualities (твердо, плотно)

der:a& dt:physq:form Ч form (плоско, пр€мо)

der:a& dt:physq:color Ч colour (красно, добела)

der:a& dt:physq:taste Ч taste (горько, вкусно)

der:a& dt:physq:smell Ч smell (смрадно, зловонно)

der:a& dt:physq:temper Ч temperature (тепло, прохладно)

der:a& dt:physq:weight Ч weight (т€жело, легко)

der:a& dt:humq Ч human qualities (внимательно, грубо)

Russian National Corpus
© 2003–2017
info@ruscorpora.ru