График распределения результатов поиска

График распределения результатов поиска по датам показывает частоту вхождения примеров в заданный подкорпус.

Распределение и сглаживание частот всегда просчитывается на полном хронологическом срезе корпуса; пользователю показывается та часть графика, которая ограничена заданными в подкорпусе датами. По умолчанию отображается диапазон дат, в котором есть результаты поиска, установлено сглаживание 3. 

Вы можете задать другие даты в пределах подкорпуса. Для этого введите новые временные границы, например, с 1900 по 2000 г. В Региональном корпусе доступен выбор детализации по дням и месяцам, например, с 01.03.1920 по 1.03.1950. При переходе из Регионального корпуса в другие корпуса график будет открываться с детализацией по годам.

Сглаживание графиков позволяет увидеть общую тенденцию за случайными колебаниями частот. Например, сглаживание в 10 лет усредняет частоту слова с учетом предшествующих и последующих 5 лет. Чтобы получить точные данные за каждую дату, установите сглаживание 0.

Нажав на кнопку «Построить», вы увидите обновленный график.

Подведя мышку к любой точке на линии, вы увидите относительную частоту употребления за определенную дату (ipm). Частота ipm определяется как количество употреблений слова за дату (например, за год), поделенное на объем корпуса на эту дату и умноженное на 1 миллион.

С помощью «окон» отображения дат и частот на графиках вы можете приближать или отдалять определенные участки графика, а также перемещаться по значениям на осях. Это полезно, когда у вас есть большие объемы данных, и вы хотите рассмотреть более узкий временной или частотный диапазон.

Нажав на «Скачать» вы можете скачать график как картинку.

Справа под графиком находится ссылка на сервис Google Ngram Viewer, работающий на русскоязычной коллекции текстов Google Books. NB: при сходной идеологии, формулы подсчета относительной частоты в сервисах Национального корпуса и Google Ngram Viewer отличаются.

Количество текстов

В некоторых корпусах под графиком вы найдете тепловую шкалу, демонстрирующую количество текстов, в которых найдены примеры в заданном подкорпусе. Информацию о равномерности распределения текстов важно учитывать при анализе графика, так как если тексты представлены неравномерно, сглаживание может искажать вид графика. 

 

В таком случае для проверки результатов рекомендуем построить график без сглаживания.

Сравнение графиков

В сервисе Сравнение запросов под графиком показаны отдельные тепловые шкалы для каждого запроса, участвующего в сравнении.

Таблицы

Под графиком можно найти таблицы с данными, использованными для отрисовки графиков. По щелчку на кнопке «Показать таблицы» выдаются таблицы с абсолютными частотами употреблений за каждый период.

Гиперссылки в таблице слева позволяют перейти к просмотру примеров из корпуса. Выбранный год будет использоваться как временный параметр пользовательского подкорпуса, который можно сбросить, один раз нажав на кнопку "Очистить".

В таблице справа приводится общее число слов в текстах за период.

Если какой-то текст создавался в течение длительного периода времени (например, в 2015-2021 гг.), то абсолютная частота слова распределяется равными долями на весь период (в данном случае, по 1/7 на каждый год). Частоты для таких периодов даются в таблице отдельной строкой. 

При переходе в вид выдачи График по ссылке из таблицы поменять детализацию выдачи результатов нельзя, так как в этом случае недостаточно данных для построения графиков в других единицах. Для полноценной работы с графиком задайте подкорпус с полным диапазоном дат.

Обновлено 04.12.2023