Telegram Web
45😁11👍6🤮2🤡1
Знаете, как я называю ILP (Integer Linear Programming)? Именно та вещь, которая реально приносят реальным людям много бабла, а не эти ваши новомодные LLM.
Большие данные с большими яйцами
👍25❤‍🔥5🤔4🤡2😁1
👍41🤬14❤‍🔥9🔥2🥰2
Рассказывал только что на паре своей команде что значит слово "гои" и почему их скамят
20👍3🤮2🤡1🥴1
11🤮2🤔1👌1🤡1
10934🔥15🌭5🤩2🤣2
Я знаю, что у меня в канале достаточно как начинающих специалистов, так и опытных

Принес вам возможностей проявить себя)

Появился чатик для начинающих питонистов, где можно обмениваться опытом и развивать нетворкинг. Бывалые питонисты же смогут поделиться своим опытом с подрастающим поколением, и сделать IT-сообщество чуточку лучше.

Что там можно сделать?

Задать любые вопросы без страха и осуждения, при этом получать на них быстрые качественные ответы
Пообщаться на стриме с опытным преподавателем, у которого более 15-ти лет опыта
Прокачать нетворк, получить заряд мотивации и, возможно, познакомиться с будущими коллегами :)

➡️ В закрепе есть бесплатный вводный курс по питону. Чатик хороший, будет полезно, подписывайтесь — ссылка на чат

На правах рекламы.
Please open Telegram to view this post
VIEW IN TELEGRAM
👎20💩168🤡5🤮4
💅33❤‍🔥1🥰1😁1🤯1
Что ж, пришло время дропнуть пост по итогам смены.
Хоть эта проектная смена и проходила во Взлете, она не была похожа на региональные большие вызовы, куда я катался два раза до этого, так как ребята приехали без заранее заготовленных проектов.
Изначально мы планировали проводить две пары лекций утром, на различные темы из машинного обучения, а затем две пары работы над проектами. Однако большая часть приехавших ничего не знала о ML, поэтому мы решили перестроить смену - первые 3 дня мы читали чисто лекции + делали практикумы по итогам лекций (по работе с sklearn, pytorch и прочим), и в последние 3 дня была уже чисто работа над проектами, почти без лекций. Я прочитал теорвер и матстат для ML, небольшой интенсивчик по оптимизации для моей команды, которая занималась адаптивным батчингом, а также теорию + практику по основам pytorch.
И в итоге... Все получилось! На выходе получились какие-то проекты, пусть и сырые, но это был результат, что в начале смены казалось недостижимым результатом. Спасибо всей нашей команде преподавателей - Максиму за общую организацию, большое количество прочитанных пар (во время которых я мог сладко досыпать), Лере за подготовку практических ноутбуков, Мише и Егору за участие в планировании смены и за кропотливую работу со своими командами, ну и мне за математику, которую школьники просили. Отмечайтесь в комментариях💪💪💪
Хоть у нас с некоторыми из вас немного другие взгляды на часть методических аспектов, все отработали хорошо. А также отлично и очень весело провели время :) Несколько раз я смеялся как умалишенный с наших приколов, также было приятно снова поиграть в манчкин, в который не играл 5+ лет.
Хоть под конец смены я и ощущал у себя немного повышенную агрессию и недосып, это было клево
31🔥10❤‍🔥7👍2👏1
Как вообще выходить на улицу погулять когда на улице холодно?🤔🤔🤔
👍30🤔4🙏42👎2
Будет сегодня кто на концерте неверлава в atmosphere?
А то очередь в 450 метров смущает.....
😁21🤮2🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
❤‍🔥52🔥2🤡2🍾2
24🥰4🤮2😁1🤡1
А с каких пор на тротуарах в Москве перестали чистить снег?
🤣29🤬12🤔61💯1
Спасибо яндекс лавка
😭47😱17😁4🤬3👍1
И вот мы здесь...
🤮48👍2011🤡6👎5
Среда мои чуваки!
46🤮2🤡1
Тоже хотите собрать полный комплект яблочной техники? Тогда покупайте мои курсы изучайте статистику.
Сегодня полезный пост, в котором мы начнем собирать статистический словарик для начинающих ML-щиков и аналитиков.
0. Центральная предельная теорема.
Святой грааль теории вероятностей, из которого статистика как наука практически родилась. Что говорит ЦПТ? Если у нас есть много независимых случайных величин из одного распределения, то их среднее (как случайная величина) будет распределена нормально, причем математическое ожидание совпадет с мат.ожиданием одной случайной величины, а дисперсия будет дисперсией одной случайной величины, деленной на кол-во наблюдений. В частности, ошибки измерений и случайный шум часто распределены нормально, что позволяет использовать MSE-loss для моделей, приближающих данные, но про это в другом посте (поддержите активностью, если вам интересно!!!).
1. Статистические гипотезы.
Статистическая гипотеза представляет из себя утверждение о параметрах модели. В тестах обычно используется два вида гипотез - нулевая и альтернативная, обозначаются H0 и H1 соответственно. Нулевая гипотеза - та, которую мы примем, если не соберем достаточных доказательств ее неправильности. Соответственно, ее можно составить по формуле "при отсутствии данных принимаем такое же решение, как если бы было верно...".
Альтернативная гипотеза - гипотеза, требующая доказательств, то есть данных, свидетельствующих о ее правильности и о том, что нулевая гипотеза неверна. Пример: вы - банк, нормальный банк, не МФО, и на основе данных хотите принять решение, является ли заемщик надежным? Тут нулевой гипотезой будет то, что заемщик - ненадежный, ибо зачем без доказательств выдавать кредит кому попало? Это экономически невыгодно.
2. Статистические тесты, уровень значимости, мощность.
После того, как мы определились с гипотезами, нужно их проверить - для этого и нужны статистические тесты. Статистические тесты вычисляют функцию от наблюдений, называемую статистику, и проверяют, попало ли это значение в "критический регион" - множество значений, при которых мы отклоняем нулевую гипотезу. Критический регион основан на знании о том, как распределена тестовая статистика. Тесты бывают односторонние и двусторонние. При одностороннем тесте вы сравниваем тестовую статистику только с одним числом, в двустороннем тесте - с двумя числами. Подробнее с этим мы разберемся в практическом примере.
Однако, помимо формулирования гипотез, перед проведением теста необходимо определиться с уровнем значимости. Уровень значимости показывает, как часто наш тест неверно отклоняет нулевую гипотезу. Более формально - это вероятность отклонить H0 при условии ее правильности. В примере с банком - как часто мы выдаем кредит ненадежным заемщикам. От уровня значимости будет зависеть критический регион теста. Обычно используется значение 0.05 - то есть мы позволяем тесту ошибочно отвергать H0 не более чем в 5% случаев.
Почему же мы не можем поставить уровень значимости очень маленьким, скажем, 0.01%, чтобы почти никогда неверно не отклонять H0? Пострадает мощность. Мощность показывает, как часто мы правильно отклоняем H0, для случая с банком - как часто мы выдаем кредит надежным заемщикам. Если поставить уровень значимости очень низким, то почти все заемщики вернут нам кредит, но самих заемщиков станет сильно меньше! При уменьшении уровня значимости мощность обычно падает, и итоговая значимость будет зависеть от наших бизнес-целей.
57🔥6🤮64👎3
Практический пример.
Давайте разберем по кусочкам z-тест - популярный тест, используемый для проверки равенства математического ожидания некоторому числу. Допустим, у нас есть сайт, для которого мы сделали новый дизайн, и мы хотим узнать, приносит ли он дополнительную прибыль. Мы проверяем только то, что он приносит больше денег - тогда тест односторонний. Если бы мы хотели проверить, что у нас вообще есть какие-то изменения, как положительные, так и отрицательные, то есть смотрели бы в обе стороны, то тест был бы двусторонним.
Нулевая гипотеза будет звучать так: новый дизайн приносит столько же прибыли, сколько и старый, либо меньше (но для одностороннего стат.теста это не важно - равенство или неравенство), то есть mu (математическое ожидание прибыли от нового дизайна) = mu0 (математическое ожидание старого дизайна, известное нам). Альтернативная гипотеза - mu > mu0.
z-тест основан на ЦПТ - при достаточно большом размере выборки ее среднее распределено нормально, при верности нулевой гипотезы распределение будет N(mu0, sigma^2 / n). Тогда (выборочное среднее - mu0)/sigma * sqrt(n) будет распределено как N(0, 1), что и будет нашей статистикой. Выберем уровень значимости 5% - как стандарт индустрии. Что тогда будет критическим регионом?
При верности нулевой гипотезы 95% статистик будут меньше 95-го перцентиля N(0, 1). Тогда, если мы возьмем этот перцентиль как критическое значение, а все, что больше него - как критический регион, то мы неверно отклоним нулевую гипотезу ровно в 5% случаев - что нам и нужно!) Соответственно, тест будет выглядеть так - посчитать нашу статистику, и сравнить с 95-ым перцентилем нормального распределения. Если она больше - отклоняем нулевую гипотезу, то есть дизайн приносит больше прибыли, если же меньше - мы не собрали достаточно статистических доказательств, что новый дизайн повысит прибыль. Тут возникает важный момент - то, что нулевая гипотеза не отвергнута, не означает, что она верна. Вот мы и приняли решение.
Спасибо за внимание, если вам понравилось то поддержите пост активностью!!!
🔥65👍43🤮3🤡2
Полезный пост с разбором работы multi-head attention
🤡85🤮3
2025/07/08 15:39:22
Back to Top
HTML Embed Code: