DATA_MATH Telegram 824
🎯 ЗАДАЧА: Восстановление распределения из агрегатов

У вас есть CSV-файл, содержащий агрегированные данные по группам пользователей в виде:

| Группа | Среднее значение | Стандартное отклонение | Кол-во наблюдений |
|--------|------------------|-------------------------|--------------------|
| A | 50.0 | 10.0 | 100 |
| B | 60.0 | 15.0 | 80 |
| C | 55.0 | 12.0 | 120 |

Ваша задача: восстановить вероятностное распределение внутри каждой группы (на уровне отдельных наблюдений) и проверить гипотезу: *"Среднее значение в группе B статистически выше, чем в группе A, на уровне значимости 0.05."*

Условия:
- У вас нет сырых данных — только агрегаты.
- Вы должны сгенерировать выборки из нормального распределения на основе предоставленных параметров и выполнить статистический тест.

💡 Разбор:

1️⃣ Генерация синтетических данных:


import numpy as np

np.random.seed(42)
a = np.random.normal(loc=50, scale=10, size=100)
b = np.random.normal(loc=60, scale=15, size=80)


2️⃣ Проверка гипотезы:


from scipy.stats import ttest_ind

stat, p_value = ttest_ind(b, a, equal_var=False)
print(f"p-value = {p_value:.4f}")


3️⃣ Вывод:

Если p_value < 0.05, гипотеза подтверждается: группа B значимо выше по среднему.

В противном случае — различие незначимо.

🧠 Подвох:

Вы не знаете, что данные на самом деле НЕ обязательно нормально распределены.

Также важно понимать, что при генерации данных по агрегатам вы делаете допущение, что выборки соответствуют нормальным законам — что может быть неверно.

📌 Дополнительный уровень:
Проведите 1000 симуляций и постройте распределение p-value, чтобы оценить устойчивость вывода при варьирующихся выборках.

🔍 Эта задача проверяет:

- знание статистики и генерации данных
- навыки формулировки гипотез
- понимание ограничений моделирования из агрегатов
- умение мыслить критически и ставить под сомнение исходные допущения
🔥9👍65



tgoop.com/data_math/824
Create:
Last Update:

🎯 ЗАДАЧА: Восстановление распределения из агрегатов

У вас есть CSV-файл, содержащий агрегированные данные по группам пользователей в виде:

| Группа | Среднее значение | Стандартное отклонение | Кол-во наблюдений |
|--------|------------------|-------------------------|--------------------|
| A | 50.0 | 10.0 | 100 |
| B | 60.0 | 15.0 | 80 |
| C | 55.0 | 12.0 | 120 |

Ваша задача: восстановить вероятностное распределение внутри каждой группы (на уровне отдельных наблюдений) и проверить гипотезу: *"Среднее значение в группе B статистически выше, чем в группе A, на уровне значимости 0.05."*

Условия:
- У вас нет сырых данных — только агрегаты.
- Вы должны сгенерировать выборки из нормального распределения на основе предоставленных параметров и выполнить статистический тест.

💡 Разбор:

1️⃣ Генерация синтетических данных:


import numpy as np

np.random.seed(42)
a = np.random.normal(loc=50, scale=10, size=100)
b = np.random.normal(loc=60, scale=15, size=80)


2️⃣ Проверка гипотезы:


from scipy.stats import ttest_ind

stat, p_value = ttest_ind(b, a, equal_var=False)
print(f"p-value = {p_value:.4f}")


3️⃣ Вывод:

Если p_value < 0.05, гипотеза подтверждается: группа B значимо выше по среднему.

В противном случае — различие незначимо.

🧠 Подвох:

Вы не знаете, что данные на самом деле НЕ обязательно нормально распределены.

Также важно понимать, что при генерации данных по агрегатам вы делаете допущение, что выборки соответствуют нормальным законам — что может быть неверно.

📌 Дополнительный уровень:
Проведите 1000 симуляций и постройте распределение p-value, чтобы оценить устойчивость вывода при варьирующихся выборках.

🔍 Эта задача проверяет:

- знание статистики и генерации данных
- навыки формулировки гипотез
- понимание ограничений моделирования из агрегатов
- умение мыслить критически и ставить под сомнение исходные допущения

BY Математика Дата саентиста


Share with your friend now:
tgoop.com/data_math/824

View MORE
Open in Telegram


Telegram News

Date: |

1What is Telegram Channels? In handing down the sentence yesterday, deputy judge Peter Hui Shiu-keung of the district court said that even if Ng did not post the messages, he cannot shirk responsibility as the owner and administrator of such a big group for allowing these messages that incite illegal behaviors to exist. On June 7, Perekopsky met with Brazilian President Jair Bolsonaro, an avid user of the platform. According to the firm's VP, the main subject of the meeting was "freedom of expression." On Tuesday, some local media outlets included Sing Tao Daily cited sources as saying the Hong Kong government was considering restricting access to Telegram. Privacy Commissioner for Personal Data Ada Chung told to the Legislative Council on Monday that government officials, police and lawmakers remain the targets of “doxxing” despite a privacy law amendment last year that criminalised the malicious disclosure of personal information. The channel also called on people to turn out for illegal assemblies and listed the things that participants should bring along with them, showing prior planning was in the works for riots. The messages also incited people to hurl toxic gas bombs at police and MTR stations, he added.
from us


Telegram Математика Дата саентиста
FROM American