Telegram Web
Яндекс выпустил исследование о российских улицах, в названии которых людям слышатся животные.

Большинство улиц по мнению людей связаны с птицами, кошек в топонимах больше, чем собак, а муха подчистую побеждает слона:

https://yandex.ru/company/researches/2023/animal-streets
29😁18🗿7👎3
Так сложилось, что в этом канале я в основном рассказываю про новинки в сфере дата-журналистики. Однако много восхитительных проектов остаются «за кадром» или даже в архивах канала. И люди, которые только начинают интересоваться нашей сферой, не имеют возможностей о них узнать.

Я предлагаю вам небольшой интерактив! Поделитесь в комментариях своими любимыми работами в сфере визуализации данных и дата-журналистики. Давайте вместе пополним свою копилку классных работ. Я начну:

1. Bussed out / The Guardian / Shirley Wu
Впечатляющий симбиоз классической журналисткой работы и дата-исследования. Материал рассказывает о национальной программе США, в рамках которой бездомные получают «билет в один конец», чтобы изменить своё место жительства. Некоторые из них воссоединяются с родственниками, некоторые получают возможность переехать в штат мечты и закрепляются за местной церковью, некоторые — ищут поддержку у друзей.

Эта работа мне нравится свой эстетикой — тут очень красивые анимации, элегантные графики и классные фото-видео вставки. За датавиз-часть отвечала Shirley Wu — про неё я шутил, что хочу быть как она, «когда я вырасту». У Shirley в портфолио действительно много красоты, советую заглянуть ещё туда.

2. Women’s Pockets Are Inferior / The Pudding
Простая в своей идее работа рассказывает о том, что карманы в женских джинсах кошмарно малы. Для своего исследования The Pudding использовали малый набор данных — вручную измерили карманы в 80 парах джинс 20 популярных брендов (мужские, женские, скинни и прямые для каждого бренда). Оказалось, что женские карманы почти в два раза короче и даже немного уже, чем мужские.

Главная прелесть работы — в подаче. Во-первых, иллюстратор не стал делать простые столбики, а в действительности нарисовал, как выглядят карманы. А во-вторых, здесь подкупает интерактивная часть, где можно положить в карманы разные предметы — от айфона до руки — и наглядно увидеть, как они там «сидят».

Ну всё, теперь жду ваши любимые проекты 🙂
🔥38👍98
А чего почти все смотрят, а проектами не делятся? 👀💔

спишу всё на сообщение в разграр рабочего дня
но вообще-то ещё не поздно ☝️
10😁7💔6
This media is not supported in your browser
VIEW IN TELEGRAM
Залипательный скроллителлинг у Washington Post в материале про цены на жильё. Каждой точкой обозначен один из округов США, анимация показывает, как цены (в процентах) менялись за каждый месяц. Чем-то похоже на пузырики, которые всплывают в газировке 🫧

Помимо красоты, у этой анимации большой функционал: в статике было бы крайне сложно показать нюансы ценообразования в зависимости от времени. Получилась бы либо «лапша» из линейных графиков, либо пришлось бы сильно жертвовать детализацией.

P.S. Скроллителлинг — это механика, при которой часть сайта меняется вместе с прокруткой страницы. Вы скроллите, на экране появляются новые надписи, график перестраивается.

https://www.washingtonpost.com/business/interactive/2023/housing-market-price-trends/

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
18🔥6👍3🤔1😎1
ТАСС экспериментирует с «Лицами Чернова», чтобы визуализировать данные о том, сколько россиян ведут здоровый образ жизни в разных федеральных округах.

Википедия сообщает, что «лица Чернова являются одним из самых эффективных способов визуализации многомерных данных», но у меня этот пример вызывает в лучшем случае улыбку — слишком уж сложно здесь извлечь какую-либо информацию.

На сайте Википедии, кстати, представлен более хороший пример — кажется, что там проще уловить какие-то отличия, потому что лица сильнее отличаются друг от друга.

В комментарии закину материал, в котором лица Чернова, на мой вкус, сработали неплохо. А вы проголосуйте, как вам визуализация ТАСС — нравится (🥰), не нравится (🗿)?
🗿135🥰18🤨8❤‍🔥11👎1
Впервые с республиканским языком я столкнулся в 2017 году, когда ездил с другом в Казань. Во второй раз — год назад, когда впервые прилетел в Сыктывкар. Тогда мне показалось удивительным, что улицы в городах подписаны дважды, а где-то «между строк» существует ещё и второй язык, помимо русского, который как будто не использует никто вокруг.

Оказалось, русский язык вытеснил на второй план не только языки регионов нашей страны, но и языки других стран. Может показаться парадоксальным, но не все кореные жители Душанбе в совершенстве владеют таджикским.

Вместе с автором CABAR.asia Наврузом Каримовым мы исследовали, как таджикский используют в интернете, и пришли к ещё более неутешительным результатам — таджикистанцы почти по любым темам обращаются в Google на русском языке. Редкие исключения — почти всегда слова, описывающие местный быт и кухню (шурпа, лепёшка, мечеть, Шайтан).

Узнать причины этого явления и подробно рассмотреть графики можно тут:
https://cabar.asia/ru/yazykovye-predpochteniya-v-tadzhikistane-chto-govoryat-dannye-poiskovyh-zaprosov

P.S. Это первое исследование, которое вышло у меня в рамках менторской поддержки журналистов в Таджикситане. В этом месяце будут и другие материалы — поделюсь с вами, с какими сложностями мы там столкнулись 🙂
🔥47👍9😢8❤‍🔥4🤔2💔2
В тему поездок хотел поделиться фотографией, которую недавно высветил айфон.

Это 2021 год, наш небольшой оргкомитет Уральского хакатона по дата-журналистике. Мы в Екатеринбурге фотографируемся у стрит-арта, посвящённого иностранным агентам.

Два человека с этого фото вынуждены были эмигрировать, Медузу объявили нежелательной организацией, а российский Дождь просто закрыли.

Время 💔
Кстати, есть кто из Екб? Арта тоже, наверное, больше уже нет?
🕊45💔3010😢8👍6🔥2
Круговорот людей в инфографике Моны Чалаби про наём и увольнения кассиров в США.

Сама Мона пишет, что подобная «текучка» вообще характерна для всех низкооплачиваемых работ. И сокрушается, что разницы между нижним и верхним потоком почти не видно, хотя нижний поток больше.

Но, судя по цифрам, там 600 000 против 570 000. Это всё-таки небольшая разница, чтобы можно было увидеть её без больших усилий.

Источник
22😱6
7x7 рассказывает историю реестра экстремистских материалов, который задумывался для борьбы с радикальными течениями, но в итоге превратился в инструмент для преследования политических активистов и случайных людей

Внутри — комментарии пострадавших и много-много статистики, основанной на анализе текстов судебных решений.

Читать: https://lr.semnasem.org/find-extremism/ (VPN)
😢28👍2🐳2
This media is not supported in your browser
VIEW IN TELEGRAM
Интересная работа Sheldon.studio для международного фестиваля Архитектуры, где (внезапно) рассматривают основные показатели стран — население, смертность, болезни, выбросы СO2...

В работе есть два режима — можно читать её как бесконечный дашборд, выбирая необходимый временной период или страну, а можно перейти в режим «историй», и увидеть основные выводы из такой статистики — например, узнать, что половина населения мира живёт в 7 странах, или что с 1975 года количество людей с ожирением увеличилось втрое.

Формат кажется немного спорным. Хотя, скорее всего, это работа для интерактивного экрана на выставке, куда любой может подойти, потыкать и узнать пару интересных фактов о мире. Но дизайн лично мне очень нравится. В режиме бездействия там вообще включается тёмная тема, и получается максимально эстетично 🥰

https://dataroom.seed360.org/
👍204🤔1
Обнаружил интересную рассылку SAMIZDATA — там будут публиковать дата-материалы о Восточной Европе и Центральной Азии.

В первом письме рассказывают о том, какая доля населения разных стран считает себя русскими. Из интересного — в каждом шестом регионе России русских — не большинство, зато есть отдельные районы Казахстана и стран Балтии, где живут почти только русские.

Ещё сквозь призму этой работы можно оценить качество данных в разных странах. Например, в России и Грузии доступны данные по регионам, в Казахстане, Украине и странах Балтии — по районам, а в Таджикситане, Узбекистане и Туркментистане одно число на всю страну.

https://blog.samizdata.co/p/the-myth-of-the-russian-world
👍237🤔6
Тут произошёл большой казус. Многие издания, включая РБК и даже сам сайт ФНС написали, что в 2022 году российские компании заработали 1,3 квадриллиона рублей. Один квадриллион — это 1000 триллионов, число с 15 нулями.

Эксперты это радостно подтвердили, рассказав множество версий, откуда в России появилось так много денег, да ещё и на фоне кризиса. Однако никто почему-то не предположил, что озвученное число — это просто ошибка в данных.

А вот Институт проблем правоприменения пишет, что таким расчётам просто нельзя верить. Судя по всему, журналисты просто сложили общую выручку по всем компаниям, не вникая в детали.

Однако, если изучить исходные данные, можно обнаружить, что в 2022 году больше всего денег сделала некая компания ООО «ЮССА», сделав 214 триллионов рублей и обогнав Лукойл (выручка 2.9 трлн руб.) и Магнит (2 трлн руб.). ИПП предполагает, что подобное значение — бугхалтерская ошибка. Вероятно — не единственная.

О чём это говорит?
Если у вас есть исходные данные — обязательно изучите распределение и отсутствующие значения. Возможно, перед суммированием и подсчётом средних часть данных придётся исключить или исправить.

А ещё эта история учит нас тому, что можно найти экспертов под самое безумное утверждение, подтвердив любую ошибку в данных 🙈

За подробной аргументацией отправлю вас в канал ИПП — там интересно.
👍65😁18😱115🔥3🌚2
В датавизе есть правила, от которых у новичков может вскружиться голова.

Например, у барчартов ни при каких обстоятельствах нельзя обрезать ноль. А у линейных графиков — можно и чаще всего даже нужно. А ещё есть коварный Lollipop Chart, который вроде бы очень похож на столбики, но и его можно строить не от нуля.

Всё дело в том, на какой вопрос отвечает график, и каким параметром визуализация кодирует числовые значения. В случае со столбиками — это длина. В случае с линейным и «леденцовым» графиком — координата.

Столбики предлагают нам сравнить величины целиком (на сколько одно число больше другого), линейный график отвечает на вопрос — стало больше или стало меньше — не уточняя, во сколько раз.

С другой стороны, даже обрезать ось в «леденцах» — это всё ещё сомнительный приём, и не стоит им злоупотреблять всякий раз, когда хочется выдать маленькую разницу за большую. Неплохой пример — здесь: по контексту и соотношению величин сразу очевидно, что на графике показан рейтинг, а не сравнение.

Вот и в примере, который прикреплён к этому сообщению, ничего страшного нет. Людей на графике обрезали, но очевидно, что никто не пытается сказать, что женщины в два раза ниже мужчин — потому что по силуэтам понятно, что люди изображены не в полный рост.

Источник: ролик Варламова про гендерное неравенство.

А в комментарии скину отвратительный график про рост 😈
👍163🤔3🥱2
Недавно исполнилась моя старая мечта — для проекта Sellesta.ai я «пощупал» данные о ценах в мексиканский аналог «Чёрной пятницы», который называется Hot Sale.

Времени на такой объём данных (15 миллионов цен) было у нас экстремально мало, поэтому получилось проверить только самые базовые гипотезы, не закапываясь в подробности. Но и тут вышло интересно.

1. Ухватить скидку на таких распродажах (по крайней мере, на Hot Sale) — вполне реально. Почти половина популярного ассортимента товаров в скидочную неделю стоила дешевле, чем в предшествующий месяц.
2. Однако здесь надо обратить внимание, что большая часть товаров дешевеет незначительно, в пределах пяти процентов. А чаще всего делают скидки на «виртуальные» товары — музыку, книги, видео.
3. С подешевевшими товарами есть также две загвоздки. Почти половина из тех, которые стоили дешевле в Hot Sale по сравнению с предшествующим месяцем, начали дешеветь ещё до Hot Sale. Вероятно, это и так не самые ходовые товары, на которые цена снижалась естественным образом.
А ещё на треть подешевевших за неделю до Hot Sale повышали цены. Мы не можем точно увидеть причину, но полагаем, это для того, чтобы скидка казалась больше, чем есть на самом деле.

Ну и очень мне нравятся графики, которые у нас с Надей Андриановой получилось сделать 🥰

Публикаций в мексиканских СМИ вышло много, например, такая:
https://tynmagazine.com/artificial-intelligence-hot-sale-revelo-crecimiento-del-e-commerce-gracias-a-ia/ (осторожно, испанский!)
21🔥8👍5🤔1
2025/07/12 20:25:56
Back to Top
HTML Embed Code: