Из общения со многими начинающими ML-специалистами заметил одну общую особенность. Они обычно не знают с чего начать. Далеко не во всех компаниях существует культура ведения DS-проектов и такие специалисты нанимаются, чтобы хоть что-то делать с помощью ML. Типа, ты ж датасайентист? Ну, вот, и разбирайся! И всё было бы ничего, если бы у такого специалиста был соответствующий опыт работы с сильными командами и чёткой структурой, но мы же про начинающих, да?
Так вот, садится такой начинающий специалист думать, чего бы такого датасайентистского поделать и начинает, например, фичи придумывать. Или данные чистить. Или модели разные перебирать. Или замки нейросетевые строить...
Но начинать надо не с этого. Начинать надо с того, чтобы разобраться как всё работает сейчас. Раз компания может позволить нанять себе датасайентиста-машинлёрнера, значит, как-то деньги она уже зарабатывает и как-то задачи решает. И когда вы захотите для решения определённой задачи взять что-то ML-ное, вам нужно будет сравнивать ваше решение с тем, что уже было. Чтобы что-то улучшать, нужно, чтобы было, что улучшать.
Зачастую в компаниях уже есть какие-то решения, основанные на эвристиках (правилах). Вот, в первую очередь, и нужно разобраться, что это за решения и как они оцениваются, а уже затем пытаться строить ML-пайплайны. Вполне может оказаться так, что эвристики работают хорошо и в данной задаче ML вообще не нужен. Это тоже хороший и достаточно ценный результат. Если вы его хорошо опишете и сохраните, это поможет не тратить ресурсы в будущем на те же исследования, что провели вы. А как говорится, рубль сэкономленный, что рубль заработанный.
А что делать, если задача стоит, а никакого решения для неё ещё вообще не было? Начальнику просто кажется, что надо задачу решить с помощью ИИ, а то перед пацанами стыдно без ИИ. Здесь тоже нужно какое-то решение, от которого в дальнейшем можно было бы оттолкнуться. Опять нужно что-то, что можно улучшать. И тут на помощь приходит такой термин как бейзлайн. Какое-то базовое решение с самым простым алгоритмом. Тупо, какая-нибудь линейная или логистическая регрессия. Во-первых, сразу ИИ в компании появится (уже не так неудобно перед пацанами), а во-вторых, такое решение, возможно, тоже окажется хорошим, если до этого никакого другого не было. Ну, а, в-третьих, последующие решения будет с чем сравнивать.
Из общения со многими начинающими ML-специалистами заметил одну общую особенность. Они обычно не знают с чего начать. Далеко не во всех компаниях существует культура ведения DS-проектов и такие специалисты нанимаются, чтобы хоть что-то делать с помощью ML. Типа, ты ж датасайентист? Ну, вот, и разбирайся! И всё было бы ничего, если бы у такого специалиста был соответствующий опыт работы с сильными командами и чёткой структурой, но мы же про начинающих, да?
Так вот, садится такой начинающий специалист думать, чего бы такого датасайентистского поделать и начинает, например, фичи придумывать. Или данные чистить. Или модели разные перебирать. Или замки нейросетевые строить...
Но начинать надо не с этого. Начинать надо с того, чтобы разобраться как всё работает сейчас. Раз компания может позволить нанять себе датасайентиста-машинлёрнера, значит, как-то деньги она уже зарабатывает и как-то задачи решает. И когда вы захотите для решения определённой задачи взять что-то ML-ное, вам нужно будет сравнивать ваше решение с тем, что уже было. Чтобы что-то улучшать, нужно, чтобы было, что улучшать.
Зачастую в компаниях уже есть какие-то решения, основанные на эвристиках (правилах). Вот, в первую очередь, и нужно разобраться, что это за решения и как они оцениваются, а уже затем пытаться строить ML-пайплайны. Вполне может оказаться так, что эвристики работают хорошо и в данной задаче ML вообще не нужен. Это тоже хороший и достаточно ценный результат. Если вы его хорошо опишете и сохраните, это поможет не тратить ресурсы в будущем на те же исследования, что провели вы. А как говорится, рубль сэкономленный, что рубль заработанный.
А что делать, если задача стоит, а никакого решения для неё ещё вообще не было? Начальнику просто кажется, что надо задачу решить с помощью ИИ, а то перед пацанами стыдно без ИИ. Здесь тоже нужно какое-то решение, от которого в дальнейшем можно было бы оттолкнуться. Опять нужно что-то, что можно улучшать. И тут на помощь приходит такой термин как бейзлайн. Какое-то базовое решение с самым простым алгоритмом. Тупо, какая-нибудь линейная или логистическая регрессия. Во-первых, сразу ИИ в компании появится (уже не так неудобно перед пацанами), а во-вторых, такое решение, возможно, тоже окажется хорошим, если до этого никакого другого не было. Ну, а, в-третьих, последующие решения будет с чем сравнивать.
‘Ban’ on Telegram Hashtags are a fast way to find the correct information on social media. To put your content out there, be sure to add hashtags to each post. We have two intelligent tips to give you: Private channels are only accessible to subscribers and don’t appear in public searches. To join a private channel, you need to receive a link from the owner (administrator). A private channel is an excellent solution for companies and teams. You can also use this type of channel to write down personal notes, reflections, etc. By the way, you can make your private channel public at any moment. How to Create a Private or Public Channel on Telegram? Telegram is a leading cloud-based instant messages platform. It became popular in recent years for its privacy, speed, voice and video quality, and other unmatched features over its main competitor Whatsapp.
from us