Частоты словоформ и словосочетаний

Вы можете скачать архивы с текстовыми файлами, содержащими частоты словоформ и словосочетаний в основном корпусе (по данным на ноябрь 2011).
При подсчёте учитывался регистр букв, а также знаки препинания.
Общий объём корпуса – 192689044 словоформы.

Словоформыzip-архив (5,5 Мб, обрезаны по частоте 3)топ-100
2-граммыzip-архив (39 Мб, обрезаны по частоте 3)топ-100
3-граммыzip-архив (31 Мб, обрезаны по частоте 3)топ-100
4-граммыzip-архив (44 Мб, обрезаны по частоте 2)топ-100
5-граммыzip-архив (28 Мб, обрезаны по частоте 2)топ-100
6-граммы топ

Обновлено