← Вернуться к старой версии Вы находитесь в новой версии Сообщить об ошибке Подробнее

Статистика корпуса

I. Распределение текстов по подкорпусам

Подкорпус Число текстов Число предложений Число словоупотреблений % словоупотреблений
Основной корпус 126 852 28 079 366 337 025 184 33.3%
- в том числе со снятой омонимией 2 170 519 726 6 003 393 0.6%
Газетный корпус СМИ 2000-х гг. 986 924 23 571 224 332 645 828 32.8%
Газетный региональный корпус 52 845 1 804 876 22 934 473 2.3%
Синтаксический корпус 734 88 512 1 250 923 0.1%
Диалектный корпус 1 080 67 932 395 440 0.0%
Обучающий корпус 229 65 666 664 747 0.1%
Параллельный корпус 4 121 10 539 891 140 253 613 13.8%
Поэтический корпус 93 406 1 237 505 12 820 698 1.3%
Устный корпус 4 210 1 877 238 13 399 937 1.3%
Акцентологический корпус 1 332 281 13 274 096 133 123 658 13.1%
Мультимедийный корпус 1 098 954 317 5 114 547 0.5%
Русский мультипарк 18 32 101 201 555 0.0%
Англо-русский мультипарк 30 21 421 229 338 0.0%
Древнерусский 27 117 449 573 250 0.1%
Берестяные грамоты 885 3 717 19 427 0.0%
Старорусский 6 214 341 202 8 136 258 0.8%
Церковнославянский 1 160 381 827 4 476 006 0.4%
Всего: 2 612 114 82 458 340 1 013 264 882 100%


II. Распределение текстов основного корпуса по видам и другим метапризнакам

Вид текста Число текстов Число предложений Число словоупотреблений % словоупотреблений
Нехудожественные письменные тексты 106 275 12 222 597 173 063 817 54.6%
Художественные письменные тексты 10 168 14 299 480 144 122 619 45.4%
Всего: 116 443 26 522 077 317 186 436 100%


Художественные тексты

Жанр Число текстов Число предложений Число словоупотреблений % словоупотреблений
автобиографическая проза 6 36 266 417 712 0.3%
детектив, боевик 127 852 675 7 650 272 5.2%
детская литература 748 707 799 6 131 648 4.2%
документальная проза 419 954 660 10 957 291 7.5%
драматургия 307 684 931 3 516 472 2.4%
историческая проза 276 1 282 258 14 032 078 9.6%
любовная история 55 169 104 1 542 336 1.1%
нежанровая проза 5 603 7 720 523 81 351 570 55.7%
перевод 4 5 940 112 931 0.1%
приключения 278 566 843 5 787 028 4.0%
прочее 85 27 781 353 017 0.2%
сентиментальная проза 30 10 867 167 334 0.1%
фантастика 656 919 557 8 875 568 6.1%
юмор и сатира 1 492 558 400 5 259 512 3.6%
Всего: 10 086 14 497 604 146 154 769 100%


Нехудожественные тексты

Сфера функционирования Число текстов Число предложений Число словоупотреблений % словоупотреблений
обиходно-бытовая 2 682 523 794 6 419 777 3.7%
официально-деловая 3 283 323 854 4 978 179 2.8%
производственно-техническая 1 125 101 704 1 379 977 0.8%
публицистика 88 512 8 543 058 118 130 756 67.3%
реклама 1 909 69 671 679 493 0.4%
учебно-научная 7 280 2 214 245 36 480 216 20.8%
церковно-богословская 1 014 257 181 4 022 012 2.3%
электронная коммуникация 752 338 645 3 339 187 1.9%
Всего: 106 557 12 372 152 175 429 597 100%


Тематика текста Число текстов Число предложений Число словоупотреблений % словоупотреблений
администрация и управление 15 006 573 863 7 533 987 3.1%
армия и вооруженные конфликты 11 219 627 256 8 705 171 3.6%
археология 20 2 028 29 284 0.0%
астрология, парапсихология, эзотерика 343 38 853 417 673 0.2%
астрономия 389 34 459 535 520 0.2%
бизнес, коммерция, экономика, финансы 10 678 519 959 7 218 314 3.0%
биология 1 075 192 906 2 958 947 1.2%
военное дело 12 12 453 235 429 0.1%
география 384 196 308 3 276 332 1.3%
геодезия 1 613 15 252 0.0%
геология 526 61 207 962 031 0.4%
горнодобывающая промышленность 393 27 164 422 038 0.2%
дом и домашнее хозяйство 1 265 86 292 1 052 896 0.4%
досуг, зрелища и развлечения 4 971 180 989 1 923 680 0.8%
естественные науки 500 64 684 849 310 0.3%
естествознание 30 13 645 209 619 0.1%
здоровье и медицина 5 377 376 358 5 119 787 2.1%
информатика 655 84 158 1 289 266 0.5%
искусство и культура 14 434 1 566 828 21 407 883 8.8%
искусствоведение 95 34 149 519 841 0.2%
история 3 736 1 193 634 19 112 294 7.9%
криминал 9 957 293 011 3 153 349 1.3%
культурология 311 106 263 1 735 621 0.7%
легкая и пищевая промышленность 279 20 951 313 911 0.1%
лесное хозяйство 88 7 854 128 996 0.1%
литература и искусство 3 729 7 114 0.0%
логика 1 3 464 51 840 0.0%
математика 169 32 731 507 704 0.2%
машиностроение 16 1 381 19 728 0.0%
металлургия 19 1 871 28 410 0.0%
минералогия 1 5 380 61 578 0.0%
наука и технологии 10 364 2 082 820 33 137 677 13.6%
наука и технологии: филология 1 242 2 989 0.0%
образование 3 195 273 811 3 818 852 1.6%
политика и общественная жизнь 30 838 2 478 798 35 777 281 14.7%
политика, экономика, критика 1 678 14 284 0.0%
политология 16 1 805 32 649 0.0%
право 3 311 297 478 4 530 417 1.9%
прикладные науки 5 194 3 820 0.0%
природа 3 882 202 795 2 723 517 1.1%
производство 4 574 247 561 3 261 346 1.3%
происшествия 200 4 106 44 611 0.0%
психология 531 159 043 2 527 723 1.0%
путешествия 1 729 469 309 7 151 508 2.9%
религия 5 884 580 314 8 976 513 3.7%
россия/ссср: советский период 2 339 4 673 0.0%
сельское хозяйство 1 885 125 303 1 735 004 0.7%
социология 397 115 962 1 759 512 0.7%
спорт 3 826 278 239 3 267 069 1.3%
статистика 328 14 851 218 704 0.1%
строительство и архитектура 1 973 116 249 1 545 593 0.6%
техника 7 315 414 215 5 413 359 2.2%
транспорт 4 425 108 035 1 195 547 0.5%
физика 1 249 113 475 1 692 061 0.7%
филология 809 324 654 5 298 806 2.2%
философия 730 427 549 7 634 150 3.1%
химическая промышленность 105 7 881 112 057 0.0%
химия 1 102 122 434 1 661 588 0.7%
частная жизнь 15 944 1 589 535 18 952 201 7.8%
чстная жизнь 1 3 150 48 376 0.0%
электроника 701 44 286 620 792 0.3%
энергетика 114 12 220 174 387 0.1%
Всего: 187 390 16 978 772 243 139 871 100%


III. Распределение текстов основного корпуса по датам создания

Период Число текстов Число предложений Число словоупотреблений % словоупотреблений
1701 - 1750 379 63 125 1 209 730 0.3%
1751 - 1800 2 257 343 458 6 383 948 1.6%
1801 - 1850 3 032 1 324 798 19 899 159 5.0%
1851 - 1900 4 949 5 084 783 68 442 729 17.3%
1901 - 1950 57 120 9 198 414 105 221 957 26.7%
1951 - 2000 21 405 10 264 800 113 097 027 28.7%
2001 - 2021 41 464 6 624 172 80 353 802 20.4%
Всего: 130 606 32 903 550 394 608 352 100%


IV. Распределение словоупотреблений по частям речи (только для корпуса со снятой грамматической омонимией)

Часть речи Число словоупотреблений % словоупотреблений
существительное 1 722 425 28.7%
прилагательное 511 009 8.5%
числительное 102 793 1.7%
- в том числе записанное прописью 43 001 0.7%
- в том числе записанное цифрами 59 792 1.0%
числительное-прилагательное 24 628 0.4%
глагол 1 014 087 16.9%
наречие 254 085 4.2%
предикатив 42 806 0.7%
вводное слово 26 766 0.4%
местоимение-существительное 471 979 7.9%
местоимение-прилагательное 280 989 4.7%
местоимение-наречие 130 447 2.2%
местоимение-предикатив (некого, нечего) 678 0.0%
предлог 627 529 10.5%
союз 476 107 7.9%
частица 266 854 4.4%
междометие 8 665 0.1%
инициал 10 128 0.2%
прочие (иностранные слова, звукоподражания) 31 409 0.5%
Всего: 6 003 384 100%


*Статистические данные представлены на 23.08.2021.

Национальный корпус русского языка
© 2003–2022
info@ruscorpora.ru