Корпус включает художественные, публицистические и эпистолярные произведения из собраний сочинений русских классических писателей.
На данный момент в корпусе представлены русскоязычные произведения
- А. Н. Радищева
- И. А. Крылова
- В. А. Жуковского
- А. С. Пушкина
- Е. А. Баратынского
- М. Ю. Лермонтова
- Н. В. Гоголя
- И. С. Тургенева
- М. Е. Салтыкова-Щедрина
- Л. Н. Толстого
- Н. С. Лескова
- А. П. Чехова
Предпочтение отдавалось оцифрованным полным собраниям сочинений, размещенным в электронных библиотеках rvb.ru и feb-web.ru. Изданные в советское время наиболее представительные собрания сочинений Жуковского, Гоголя и Лескова не являются полными, в том числе и из идеологических соображений. Тексты Л. Н. Толстого и А. П. Чехова конвертированы из коллекций соответствующих цифровых проектов. В корпус не были включены редакторские переводы текстов на иностранных языках. Включаются также тексты, написанные в основном на иностранном языке, но содержащие нетривиальные русские слова и словосочетания или черновые версии на русском языке.
По умолчанию тексты в поисковой выдаче отсортированы от более ранних к более поздним. Доступна также сортировка по имени автора (а внутри текстов одного автора — по жанру и названию). В корпусе можно построить диахронический график частотности, а также сравнивать на графике несколько запросов.
Сейчас корпус находится в бета-версии, планируется его пополнение новыми авторами и произведениями. Приблизительный объем текстов — 18 млн словоупотреблений.