Статистика в портрете корпуса

В разделе Статистика корпуса представлены таблицы, графики и диаграммы, характеризующие объем и состав корпуса на данный момент и во времени:

  1. Таблица и график с объемом корпуса в текстах и словах.
  2. Географическая карта и график распределения объема по странам и регионам (только для корпусов с региональной разметкой).
  3. Круговая диаграмма и график распределения значений метаатрибутов.

Получить доступ к статистике корпуса можно через портрет корпуса, нажав на кнопку (i) в шапке корпуса.

Для всех диаграмм и графиков в разделе Статистика предусмотрена стандартная всплывающая подсказка (?), в которой объясняется, как интерпретировать визуализацию, а также возможность скачать исходные данные, использованные для построения визуализации, и/или скриншот.

В настоящий момент статистика доступна в Основном, Обучающем, Газетных корпусах, некоторых исторических корпусах, а также корпусах «‎Русская классика»‎ и «‎От 2 до 15». В дальнейшем список таких корпусов будет расширяться.

Текущее состояние

Объем корпуса

В разделе Текущее состояние данные об объеме корпуса представлены в количестве текстов и слов.

 

Географическая карта

На географической карте показано региональное распределение объема корпуса в выбранной единице измерения (тексты или слова). При переключении единицы измерения карта перерисовывается. 

Об объеме корпуса в том или ином регионе можно судить по цветовой шкале. При наведении мыши на закрашенную область можно увидеть название региона и соответствующее ему количество текстов или слов в корпусе.

Нажав на Скачать, пользователь может выгрузить Excel/CSV с исходными данными, использованными для построения карты.

 

Распределение текстов

Круговая диаграмма показывает, какие виды текстов представлены в корпусе. Пользователь может выбрать метаатрибут, для которого нужно построить диаграмму, из списка наиболее показательных атрибутов корпуса, а также единицу измерения объема – тексты или слова. При переключении метаатрибута и/или единицы измерения диаграмма перерисовывается.

На диаграмме показано распределение топ-10 значений выбранного метаатрибута. Остальные значения объединены в категорию прочее. Справа от диаграммы приведен список значений и доля в процентах. При наведении мыши на сектор диаграммы можно увидеть название значения и соответствующее ему количество текстов или слов в корпусе.

Нажав на Скачать пользователь может выгрузить Excel/CSV с исходными данными, использованными для построения диаграмм, а также скачать диаграмму как картинку. 

Сравнить пользовательский подкорпус с целым корпусом можно с помощью Статистики в портрете подкорпуса 
 

Распределение по времени

В разделение Распределение по времени пользователь может выбрать уровень детализации, задать диапазон дат и сглаживание. Указанные параметры являются общими для всех графиков на странице.

Распределение объема корпуса во времени

На графике Распределение объема корпуса во времени представлены данные об объеме корпуса. По оси X указана дата создания текста, по оси Y - число текстов корпуса, созданных в эту дату.

 

Распределение текстов

График Распределение текстов показывает, какие виды текстов представлены в корпусе. Пользователь может выбрать метаатрибут, для которого нужно построить график, из списка наиболее показательных атрибутов корпуса, а также единицу измерения объема - тексты или слова. При переключении метаатрибута и/или единицы измерения график перерисовывается.

На графике показано распределение топ-10 значений выбранного метаатрибута, остальные значения объединены в категорию прочее. Справа от графика приведен список значений. При наведении мыши на график можно увидеть название значения и соответствующее ему количество и долю текстов или слов в корпусе.

 

Регионы

График показывает распределение объема текстов корпуса во времени по странам и регионам. При переключении метаатрибута и/или единицы измерения график перерисовывается.

Справа от графика приведен список значений. При наведении мыши на график можно увидеть название региона и соответствующее ему количество и долю текстов или слов в корпусе.

Обновлено 28.05.2024