CHOKING_DATA Telegram 41
Forwarded from Matt
Давайте я попробую пересказать то, что пишет Максим, чуть более упрощенно. Максим может меня поправить, если я где-то навру.

1. Подход с планированием исследования и предварительным расчетом выборки -- идея скорее хорошая и оно должно бы так работать. На практике однако возникает вопрос, как определить границу минимально интересного эффекта и как определить ожидаемую дисперсию в группах.

2. В медицине это превратилось в карго-культ потому, что по факту там занимаются подгонкой задачи под ответ. То есть не на основе вводных считают количество пациентов, а наоборот: у нас есть понимание, сколько мы можем набрать пациентов / сколько их есть, и дальше мы подбираем такие значения границы эффекта и дисперсий, чтобы получить то количество пациентов, которое нам надо. Честнее было бы написать сразу, что проанализировали столько, сколько нашли.

3. В классической статистике у нас есть асимметрия между нулевой и альтернативной гипотезами. Мы можем отвергнуть нулевую гипотезу в пользу альтернативы, которую принимаем (потому что вероятность ошибки первого рода у нас под контролем). Однако вероятность ошибки второго рода мы не можем контролировать явно, поэтому мы не можем принять нулевую гипотезу, мы ее просто не отвергаем, что по факту надо интерпретировать как "на этих данных мы ничего не можем сказать" (потому что хз, то ли нулевая гипотеза и правда верна, то ли просто выборка маловата).

Расчет выборки позволяет нам проконтролировать вероятность ошибки второго рода, таким образом мы можем не только отвергнуть нулевую гипотезу, но и принять ее.

4. Сам расчет выборки исходя из мощности сильно завязан на тестирование гипотез. При этом тестирование гипотез -- это дихотомизирующая процедура, ответ которой "да / хз" в общем случае и "да / нет" при посчитанной выборке. Это все сильно ограничивает нас и надо бы от разговора о мощности теста перейти к разговору об оценке эффекта. То есть не гипотезы тестировать, а доверительные интервалы строить. И считать выборку так, чтобы достигнуть заранее предписанной длины доверительного интервала.

5. Расчет выборки, если мы говорим про что-то сложнее т-теста -- нетривальная задача, потому что для него требуется много вводных, которые еще и сложным образом зависят друг от друга. Поэтому как правило считается не точная выборка ("при такой-то выборке мощность ровно такая-то"), а ее верхняя оценка ("при такой-то выборке мощность как минимум вот такая").



tgoop.com/choking_data/41
Create:
Last Update:

Давайте я попробую пересказать то, что пишет Максим, чуть более упрощенно. Максим может меня поправить, если я где-то навру.

1. Подход с планированием исследования и предварительным расчетом выборки -- идея скорее хорошая и оно должно бы так работать. На практике однако возникает вопрос, как определить границу минимально интересного эффекта и как определить ожидаемую дисперсию в группах.

2. В медицине это превратилось в карго-культ потому, что по факту там занимаются подгонкой задачи под ответ. То есть не на основе вводных считают количество пациентов, а наоборот: у нас есть понимание, сколько мы можем набрать пациентов / сколько их есть, и дальше мы подбираем такие значения границы эффекта и дисперсий, чтобы получить то количество пациентов, которое нам надо. Честнее было бы написать сразу, что проанализировали столько, сколько нашли.

3. В классической статистике у нас есть асимметрия между нулевой и альтернативной гипотезами. Мы можем отвергнуть нулевую гипотезу в пользу альтернативы, которую принимаем (потому что вероятность ошибки первого рода у нас под контролем). Однако вероятность ошибки второго рода мы не можем контролировать явно, поэтому мы не можем принять нулевую гипотезу, мы ее просто не отвергаем, что по факту надо интерпретировать как "на этих данных мы ничего не можем сказать" (потому что хз, то ли нулевая гипотеза и правда верна, то ли просто выборка маловата).

Расчет выборки позволяет нам проконтролировать вероятность ошибки второго рода, таким образом мы можем не только отвергнуть нулевую гипотезу, но и принять ее.

4. Сам расчет выборки исходя из мощности сильно завязан на тестирование гипотез. При этом тестирование гипотез -- это дихотомизирующая процедура, ответ которой "да / хз" в общем случае и "да / нет" при посчитанной выборке. Это все сильно ограничивает нас и надо бы от разговора о мощности теста перейти к разговору об оценке эффекта. То есть не гипотезы тестировать, а доверительные интервалы строить. И считать выборку так, чтобы достигнуть заранее предписанной длины доверительного интервала.

5. Расчет выборки, если мы говорим про что-то сложнее т-теста -- нетривальная задача, потому что для него требуется много вводных, которые еще и сложным образом зависят друг от друга. Поэтому как правило считается не точная выборка ("при такой-то выборке мощность ровно такая-то"), а ее верхняя оценка ("при такой-то выборке мощность как минимум вот такая").

BY душно про дату


Share with your friend now:
tgoop.com/choking_data/41

View MORE
Open in Telegram


Telegram News

Date: |

Telegram iOS app: In the “Chats” tab, click the new message icon in the right upper corner. Select “New Channel.” In the next window, choose the type of your channel. If you want your channel to be public, you need to develop a link for it. In the screenshot below, it’s ”/catmarketing.” If your selected link is unavailable, you’ll need to suggest another option. For crypto enthusiasts, there was the “gm” app, a self-described “meme app” which only allowed users to greet each other with “gm,” or “good morning,” a common acronym thrown around on Crypto Twitter and Discord. But the gm app was shut down back in September after a hacker reportedly gained access to user data. According to media reports, the privacy watchdog was considering “blacklisting” some online platforms that have repeatedly posted doxxing information, with sources saying most messages were shared on Telegram. Commenting about the court's concerns about the spread of false information related to the elections, Minister Fachin noted Brazil is "facing circumstances that could put Brazil's democracy at risk." During the meeting, the information technology secretary at the TSE, Julio Valente, put forward a list of requests the court believes will disinformation.
from us


Telegram душно про дату
FROM American