Стать специалистом по машинному обучению@toBeAnMLspecialist P.943

Стать специалистом по машинному обучению

Правило бейзлайна

Из общения со многими начинающими ML-специалистами заметил одну общую особенность. Они обычно не знают с чего начать. Далеко не во всех компаниях существует культура ведения DS-проектов и такие специалисты нанимаются, чтобы хоть что-то делать с помощью ML. Типа, ты ж датасайентист? Ну, вот, и разбирайся! И всё было бы ничего, если бы у такого специалиста был соответствующий опыт работы с сильными командами и чёткой структурой, но мы же про начинающих, да?

Так вот, садится такой начинающий специалист думать, чего бы такого датасайентистского поделать и начинает, например, фичи придумывать. Или данные чистить. Или модели разные перебирать. Или замки нейросетевые строить...

Но начинать надо не с этого. Начинать надо с того, чтобы разобраться как всё работает сейчас. Раз компания может позволить нанять себе датасайентиста-машинлёрнера, значит, как-то деньги она уже зарабатывает и как-то задачи решает. И когда вы захотите для решения определённой задачи взять что-то ML-ное, вам нужно будет сравнивать ваше решение с тем, что уже было. Чтобы что-то улучшать, нужно, чтобы было, что улучшать.

Зачастую в компаниях уже есть какие-то решения, основанные на эвристиках (правилах). Вот, в первую очередь, и нужно разобраться, что это за решения и как они оцениваются, а уже затем пытаться строить ML-пайплайны. Вполне может оказаться так, что эвристики работают хорошо и в данной задаче ML вообще не нужен. Это тоже хороший и достаточно ценный результат. Если вы его хорошо опишете и сохраните, это поможет не тратить ресурсы в будущем на те же исследования, что провели вы. А как говорится, рубль сэкономленный, что рубль заработанный.

А что делать, если задача стоит, а никакого решения для неё ещё вообще не было? Начальнику просто кажется, что надо задачу решить с помощью ИИ, а то перед пацанами стыдно без ИИ. Здесь тоже нужно какое-то решение, от которого в дальнейшем можно было бы оттолкнуться. Опять нужно что-то, что можно улучшать. И тут на помощь приходит такой термин как бейзлайн. Какое-то базовое решение с самым простым алгоритмом. Тупо, какая-нибудь линейная или логистическая регрессия. Во-первых, сразу ИИ в компании появится (уже не так неудобно перед пацанами), а во-вторых, такое решение, возможно, тоже окажется хорошим, если до этого никакого другого не было. Ну, а, в-третьих, последующие решения будет с чем сравнивать.

www.tgoop.com/toBeAnMLspecialist/943

3.1K viewsFeb 3 at 12:33

tgoop.com/toBeAnMLspecialist/943

Create: 2025-02-03
Last Update: 2025-02-23 21:30:37

BY Стать специалистом по машинному обучению

Share with your friend now:
tgoop.com/toBeAnMLspecialist/943

Telegram News

Правило бейзлайна