|
English
Статистика Корпуса
Национальный корпус русского языка в январе 2008 г. содержал
52 392 текста общим объемом
149 357 020 словоупотреблений.
I. Распределение текстов по подкорпусам
| Подкорпус | Число текстов | Число словоупотреблений
|
|---|
| Основной корпус | 42 387 | 147 577 522
| в том числе со снятой омонимией: | 2 215 | 5 884 661
| | Диалектный корпус | 122 | 144 099
| | Поэтический корпус | 9 675 | 2 586 710
| | Обучающий корпус | 230 | 649 684
| |
II. Распределение текстов основного корпуса по видам и другим метапризнакам
| Вид текста | Число текстов | Число словоупотреблений | % словоупотреблений
|
|---|
| Художественные письменные тексты | 3 893 | 58 547 176 | 39,7
| | Нехудожественные письменные тексты | 37 249 | 83 218 964 | 56,4
| | Устная речь | 1 245 | 5 810 482 | 3,9
|
Художественные тексты
| Жанр | Число текстов | Число словоупотреблений | % словоупотреблений
|
|---|
| автобиографическая проза | 3 | 323 808 | 0,6
| | детектив, боевик | 65 | 4 796 573 | 8,2
| | детская литература | 380 | 2 479 165 | 4,2
| | документальная проза | 109 | 3 177 007 | 5,4
| | драматургия | 92 | 1 236 635 | 2,1
| | историческая проза | 82 | 2 968 863 | 5,1
| | любовная история | 29 | 622 838 | 1,1
| | нежанровая проза | 2 008 | 35 199 610 | 60,1
| | приключения | 11 | 1 246 928 | 2,1
| | фантастика | 174 | 3 902 519 | 6,7
| | юмор и сатира | 788 | 1 566 038 | 2,7
| | прочее | 152 | 1 027 541 | 1,8
| | Всего: | 3 893 | 58 547 525 | 100,0
|
Нехудожественные тексты
| Сфера функционирования | Число текстов | Число словоупотреблений | % словоупотреблений
|
|---|
| бытовая | 590 | 1 986 286 | 2,4
| | официально-деловая | 1 244 | 1 814 812 | 2,2
| | производственно-техническая | 131 | 233 569 | 0,3
| | публицистика | 28 659 | 56 549 987 | 68,0
| | реклама | 1 221 | 513 955 | 0,6
| | учебно-научная | 4 578 | 18 269 877 | 22,0
| | церковно-богословская | 735 | 2 540 674 | 3,1
| | электронная коммуникация | 91 | 1 310 804 | 1,6
| | Всего: | 37 249 | 83 219 964 | 100,0
|
| | Тематика текста | Число текстов | Число словоупотреблений | % словоупотреблений
|
|---|
| администрация и управление | 344 | 233 211 | 0,3
| | армия и вооруженные конфликты | 705 | 1 668 166 | 2,0
| | астрология, парапсихология, эзотерика | 54 | 49 607 | 0,1
| | бизнес, коммерция, экономика, финансы | 3 447 | 2 721 353 | 3,3
| | дом и домашнее хозяйство | 824 | 671 190 | 0,8
| | досуг, зрелища и развлечения | 807 | 516 326 | 0,6
| | здоровье и медицина | 856 | 2 227 828 | 1,5
| | информационные технологии | 16 | 14 583 | 0,0
| | искусство и культура | 3 289 | 5 236 518 | 6,3
| | криминал | 658 | 496 855 | 0,6
| | мемуары, записные книжки, дневники | 419 | 20 604 802 | 24,8
| | наука и технологии | 5 446 | 17 334 780 | 20,8
| | образование | 163 | 172 806 | 0,2
| | политика и общественная жизнь | 11 217 | 15 526 635 | 18,7
| | право | 506 | 1 359 877 | 1,6
| | природа | 327 | 550 070 | 0,7
| | производство | 1 007 | 912 649 | 1,1
| | религия | 1 036 | 3 502 679 | 4,2
| | сельские хозяйство | 211 | 129 089 | 0,2
| | спорт | 1 377 | 1 779 891 | 2,1
| | техника | 869 | 820 206 | 1,0
| | транспорт | 169 | 162 310 | 0,2
| | философия | 90 | 1 411 709 | 1,7
| | частная жизнь | 2 927 | 5 730 035 | 6,9
| | Всего: | 37 249 | 83 219 964 | 100,0
|
Устная речь
| Тип | Число текстов | Число словоупотреблений | % словоупотреблений
|
|---|
| публичная речь | 617 | 3 738 790 | 64,3
| | непубличная речь | 445 | 470 597 | 8,1
| | речь кино | 183 | 1 601 095 | 27,6
| | Всего: | 1 245 | 5 810 482 | 100,0
|
II. Распределение словоупотреблений по частям речи
(только для корпуса со снятой грамматической омонимией, данные на 28 ноября 2007 г. — объём корпуса со снятой омонимией 5,5 млн)
| Часть речи | Число словоупотреблений | % словоупотреблений
|
|---|
| существительное | 1 554 272 | 28,50
| | прилагательное | 465 743 | 8,54
| | числительное | 82 809 | 1,52
| в том числе записанные прописью | 39 827 | 0,73
| | в том числе записанные цифрами | 42 982 | 0,79
| | числительное-прилагательное | 21 081 | 0,39
| | глагол | 931 687 | 17,08
| | наречие | 222 502 | 4,08
| | предикатив | 38 260 | 0,70
| | вводное слово | 24 954 | 0,46
| | местоимение-существительное | 443 205 | 8,13
| | местоимение-прилагательное | 255 772 | 4,69
| | местоименное наречие | 120 568 | 2,21
| | местоимение-предикатив (некого, нечего) | 602 | 0,01
| | предлог | 568 295 | 10,42
| | союз | 433 815 | 7,95
| | частица | 258 085 | 4,73
| | междометие | 7 192 | 0,13
| | инициал | 9 726 | 0,18
| | прочие (иностранные слова, звукоподражания) | 15 781 | 0,29
| | Всего: | 5 454 349 | 100,00
| |
|