tgoop.com/data_bar/53
Last Update:
Packed Bubbles с сортировкой или все телеграм каналы на одной визуализации
Не все диаграммы популярны. Диаграмма Packed Bubbles очень редко используется в бизнесе, хотя в Tableau она есть в стандартных и вызывается из меню 'Show Me'.
Суть диаграммы в том, чтобы представить набор данных в виде кругов (пузырей), где в размере каждого пузыря будет какая-то метрика датасета. Можно в цвет закинуть какую-то категорию.
Теперь о нетривиальности таких диаграмм. Мы можем задавать порядок следования пузырей и категорий. Про это не все знают, поэтому, сегодня расскажу о радиальных Packed Bubbles на примере визуализации Telegram каналов и тематик этих каналов.
Визуализация 'Public Telegram Channels' интерактивна, можно фильтровать по каналам, искать каналы по ключевым словам, а также переходить на выбранные каналы прямо в Telegram. Понятно что для принятия решений такое вряд ли подойдет, но подобные диаграммы позволяют оценить масштаб всех данных. к тому же интересно на них что-то поискать. Еще можно переключать типы диаграмм, по-сути, выбирать порядок сортировки и иерархию категорий.
В заглавном изображении показаны 4 диаграммы, отображающие одно и то же:
- каждый круг - один телеграм-канал, где площадь круга отображает число подписчиков.
- цвет - тема канала
Мы можем задавать порядок сортировки категорий и порядок каналов(кругов) внутри категорий.
Рис. 1
- Категории сортируются от центра круга от меньшей (где меньше всего число каналов) к большей
- Круги сортируются от центра по числу подписчиков от наименьшего к наибольшему.
В итоге, получается что в каждом цветном кольце каналы тоже сортируются.
Рис. 2
- Категории сортируются от центра круга от меньшей (где меньше всего число каналов) к большей
- Круги сортируются от центра по числу подписчиков от наибольшего к наименьшему.
Диаграмма изменилась только из-за порядка сортировки, но отражает то же самое
Рис. 3
- Сортируем каналы по их рангу внутри каждой категории
То есть, каналы с самым большим числом подписчиком из каждой категории, будут в центре
Рис.4.
Добавляем еще одну категорию - страна.
- Категории сортируются от центра круга от меньшей (где меньше всего число каналов) к большей
- Круги сортируются от центра по числу подписчиков от наименьшего к наибольшему.
- По стране канала от меньшему к большему
Появляются 'кольца' для каждой страны.
Здесь стоит остановиться на порядке разбиения данных (иерархии уровней данных):
- Сначала разбиваем на страны
- Далее внутри каждой страны разбиваем на категории
- Потом разбиваем на каналы внутри каждой категории
Порядок разбиения задается порядком следования полей на панели Marks, сверху вниз.
Как видим, можно включать любое число уровней данных в грануляцию и настраивать сортировку на каждом уровне по-своему. Иерархия уровней данных также важна. Это справедливо для других диаграмм тоже. Сортировку и порядок разбиения данных иногда недооценивают при построении диаграмм, но, как видим, они существенно могут изменить вид и смысл диаграммы.
BY Data Bar
Share with your friend now:
tgoop.com/data_bar/53