Notice: file_put_contents(): Write of 11835 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50
Датавизнутая@dataviz_addict P.28
DATAVIZ_ADDICT Telegram 28
Распределение буквы по позициям в слове

Сегодня расскажу про поиск способа подсчета распределения буквы "ё" в слове.

Этап 1

При визуализации сведенных исходных данных по позиции не учитывается то, что, например, в одном слове "ё" на пятой позиции находится в конце, а в другом — посередине.

Переведем абсолютное место "ё" в относительное — проценты от длины слова. График получается шумным, тенденцию уловить сложно.

Можно измерить удаленность позиции "ё" от середины или конца слова, но при таком подходе снова не учитывается разница длины слов.

Этап 2

На помощь пришла статья про метод разделения слова (binning). Концептуально не отличается от процентов: делим длину на части и считаем, сколько таких частей "занимает" позиция буквы (только частей меньше ста). Этот подход помогает контролировать детальность данных и шум.

Для более точного определения центра слова нужно нечетное число частей. Остается выбрать наименее шумный вариант (в нашем случае — 3 части) и посчитать коэффициент.

#датавиз #рабочее



tgoop.com/dataviz_addict/28
Create:
Last Update:

Распределение буквы по позициям в слове

Сегодня расскажу про поиск способа подсчета распределения буквы "ё" в слове.

Этап 1

При визуализации сведенных исходных данных по позиции не учитывается то, что, например, в одном слове "ё" на пятой позиции находится в конце, а в другом — посередине.

Переведем абсолютное место "ё" в относительное — проценты от длины слова. График получается шумным, тенденцию уловить сложно.

Можно измерить удаленность позиции "ё" от середины или конца слова, но при таком подходе снова не учитывается разница длины слов.

Этап 2

На помощь пришла статья про метод разделения слова (binning). Концептуально не отличается от процентов: делим длину на части и считаем, сколько таких частей "занимает" позиция буквы (только частей меньше ста). Этот подход помогает контролировать детальность данных и шум.

Для более точного определения центра слова нужно нечетное число частей. Остается выбрать наименее шумный вариант (в нашем случае — 3 части) и посчитать коэффициент.

#датавиз #рабочее

BY Датавизнутая






Share with your friend now:
tgoop.com/dataviz_addict/28

View MORE
Open in Telegram


Telegram News

Date: |

Ng was convicted in April for conspiracy to incite a riot, public nuisance, arson, criminal damage, manufacturing of explosives, administering poison and wounding with intent to do grievous bodily harm between October 2019 and June 2020. There have been several contributions to the group with members posting voice notes of screaming, yelling, groaning, and wailing in different rhythms and pitches. Calling out the “degenerate” community or the crypto obsessives that engage in high-risk trading, Co-founder of NFT renting protocol Rentable World emiliano.eth shared this group on his Twitter. He wrote: “hey degen, are you stressed? Just let it out all out. Voice only tg channel for screaming”. Today, we will address Telegram channels and how to use them for maximum benefit. 3How to create a Telegram channel? The imprisonment came as Telegram said it was "surprised" by claims that privacy commissioner Ada Chung Lai-ling is seeking to block the messaging app due to doxxing content targeting police and politicians.
from us


Telegram Датавизнутая
FROM American