English

Статистика Корпуса

Национальный корпус русского языка в январе 2008 г. содержал 52 392 текста общим объемом 149 357 020 словоупотреблений.

I. Распределение текстов по подкорпусам

Подкорпус Число текстов Число словоупотреблений
Основной корпус42 387 147 577 522
в том числе со снятой омонимией: 2 215 5 884 661
Диалектный корпус 122 144 099
Поэтический корпус 9 675 2 586 710
Обучающий корпус 230 649 684

II. Распределение текстов основного корпуса по видам и другим метапризнакам

Вид текста Число текстов Число словоупотреблений% словоупотреблений
Художественные письменные тексты 3 893 58 547 176 39,7
Нехудожественные письменные тексты 37 249 83 218 964 56,4
Устная речь 1 245 5 810 482 3,9

Художественные тексты

Жанр Число текстов Число словоупотреблений % словоупотреблений
автобиографическая проза 3 323 808 0,6
детектив, боевик 65 4 796 573 8,2
детская литература 380 2 479 165 4,2
документальная проза 109 3 177 007 5,4
драматургия 92 1 236 635 2,1
историческая проза 82 2 968 863 5,1
любовная история 29 622 838 1,1
нежанровая проза 2 008 35 199 610 60,1
приключения 11 1 246 928 2,1
фантастика 174 3 902 519 6,7
юмор и сатира 788 1 566 038 2,7
прочее 152 1 027 541 1,8
Всего: 3 893 58 547 525 100,0

Нехудожественные тексты

Сфера функционирования Число текстов Число словоупотреблений % словоупотреблений
бытовая 590 1 986 286 2,4
официально-деловая 1 244 1 814 812 2,2
производственно-техническая 131 233 569 0,3
публицистика 28 659 56 549 987 68,0
реклама 1 221 513 955 0,6
учебно-научная 4 578 18 269 877 22,0
церковно-богословская 735 2 540 674 3,1
электронная коммуникация 91 1 310 804 1,6
Всего: 37 249 83 219 964 100,0

Тематика текста Число текстов Число словоупотреблений % словоупотреблений
администрация и управление 344 233 211 0,3
армия и вооруженные конфликты 705 1 668 166 2,0
астрология, парапсихология, эзотерика 54 49 607 0,1
бизнес, коммерция, экономика, финансы 3 447 2 721 353 3,3
дом и домашнее хозяйство 824 671 190 0,8
досуг, зрелища и развлечения 807 516 326 0,6
здоровье и медицина 856 2 227 828 1,5
информационные технологии 16 14 583 0,0
искусство и культура 3 289 5 236 518 6,3
криминал 658 496 855 0,6
мемуары, записные книжки, дневники 419 20 604 802 24,8
наука и технологии 5 446 17 334 780 20,8
образование 163 172 806 0,2
политика и общественная жизнь 11 217 15 526 635 18,7
право 506 1 359 877 1,6
природа 327 550 070 0,7
производство 1 007 912 649 1,1
религия 1 036 3 502 679 4,2
сельские хозяйство 211 129 089 0,2
спорт 1 377 1 779 891 2,1
техника 869 820 206 1,0
транспорт 169 162 310 0,2
философия 90 1 411 709 1,7
частная жизнь 2 927 5 730 035 6,9
Всего: 37 249 83 219 964 100,0

Устная речь

Тип Число текстов Число словоупотреблений % словоупотреблений
публичная речь 617 3 738 790 64,3
непубличная речь 445 470 597 8,1
речь кино 183 1 601 095 27,6
Всего: 1 245 5 810 482 100,0

II. Распределение словоупотреблений по частям речи
(только для корпуса со снятой грамматической омонимией, данные на 28 ноября 2007 г. — объём корпуса со снятой омонимией 5,5 млн)

Часть речи Число словоупотреблений % словоупотреблений
существительное 1 554 272 28,50
прилагательное 465 743 8,54
числительное 82 809 1,52
в том числе записанные прописью 39 827 0,73
в том числе записанные цифрами 42 982 0,79
числительное-прилагательное 21 081 0,39
глагол 931 687 17,08
наречие 222 502 4,08
предикатив 38 260 0,70
вводное слово 24 954 0,46
местоимение-существительное 443 205 8,13
местоимение-прилагательное 255 772 4,69
местоименное наречие 120 568 2,21
местоимение-предикатив (некого, нечего) 602 0,01
предлог 568 295 10,42
союз 433 815 7,95
частица 258 085 4,73
междометие 7 192 0,13
инициал 9 726 0,18
прочие (иностранные слова, звукоподражания) 15 781 0,29
Всего: 5 454 349 100,00

Национальный корпус русского языка
© 2003–2010
info@ruscorpora.ru