Artificial stupidity

#interview #advice

Какой процесс собеседования мне кажется адекватным? (часть 1)

Начну с того, что собеседования проводят кто во что горазд. Это сложно, причем все сложнее с ростом уровня кандидата. Оттого и получаются очень полярные истории от "поговорить по душам" до "экзамен по олимпиадным задачкам".

Сам я больше склоняюсь к "поговорить по душам", но задачи в том или ином виде приходится задавать, чтобы срезать тех, кто совсем ничего не может сформулировать по итогам задачи.

Какие основные темы, которые обычно спрашивают на собеседованиях (и я в том числе):
1. Прикладная статистика. Сюда же можно отнести и вопросы на теорию, задачки на тервер и статистику. Очень не люблю задачки на какие-то формулы в этой секции, куда более подходящим считаю копать в сторону опыта (или интуиции при отсутствии такого) в области прикладной статистики, к примеру, попросив описать, как проводятся A/B тесты, почему стоит разбивать группы так, а не иначе, почему используются такие тесты и какие могут быть подводные камни;
2. Python, другие языки и технологии. Т.к., де-факто Python является наиболее частым в области анализа данных (но, конечно, кто-то может использовать R, для computer vision будет важен C++, а дата-инженерам может быть важнее Java или Scala), то обычно его и спрашивают.
Здесь задачку считаю куда более уместной, но задачу не очень высокого уровня, которая просто отсекает совсем плохо сведущих в языке. Задачи на live-кодинг, в принципе, дать можно, но если это что-то сложное, то отнимет слишком много времени. Ну и не все кандидаты могут без нервов решить сложную задачу на кодинг на время, еще и перед глазами интервьюера. Потому считаю вполне допустимым либо давать задачи попроще, либо позволять гуглить, но давать более размытую постановку. Умение гуглить очень важно в работе, так что глупо считать, что у кандидата должно быть все в памяти, а решать он должен задачки на кручение деревьев и выдумывание сортировок. Умный кандидат таким заниматься не будет (если только не собирается в FAANG, но то другая история, они могут позволить себе куда больше обычного места), а дурак вызубрит.
Про технологии лучше общаться в виде обсуждения. Можно на ситуации, можно просто с вопросами, что и как делалось в каком-либо проекте у кандидата.
Если есть github или аналог - то совсем круто. Я их обычно просматриваю, т.к. сразу можно видеть какие-т примеры работ. Но наличие github обязательным не считаю, т.к. это скорее история про хобби, а не про работу.
3. SQL, классическая аналитика. Здесь уместна простая задачка, чтобы понять, что там с SQL. Но т.к. это очень быстро учится, смысла сильно карать за это нет. Вопросы про внутренности каких-либо СУБД считаю странными, если только у кандидата не написано, что он профи в одной из них. Но общие вопросы SQL/NoSQL, звезду/снежинку можно задать, чтобы оценить уровень кругозора.
По аналитике можно смоделировать ситуацию и спросить, что же кандидат будет делать в ней. Либо можно попросить визуализировать набор данных (хотя бы указать, какой тип визуализации использовался бы). Отчасти это совмещается с вопросами про статистику, так что можно сделать переход от секции к секции.
4. ML/DL. Здесь больше люблю задавать вопросы про проекты кандидата с последующим уходом вглубь технической реализации, выбора метрик и прочего. Еще люблю открытую постановку кейса с таким же постепенным усложнением.
Вопросы, в стиле "вспомни формулу функционала оптимизации для такой-то задачки" считаю избыточными, т.к. помнить такое будут либо свежие выпускники, либо кто-то, кому повезло недавно на это наткнуться.
А вот вопросы на метрики и их выбор куда более уместны. Все же правильно поставленный вопрос - большая часть ответа. Так вот и правильные метрики - весьма важная часть ML решения.
По DL только общие вопросы, но это не моя специализация. В основном, на понимание разных архитектур, подводные камни тех или иных решений.
5. BigData (опционально).

👍1

158 views11:00