tgoop.com/datasciencework/461
Last Update:
#удаленка #вакансия #Datascientist #middle
☁️Позиция: middle Data Scientist
🏙Компания: IT Pearls (проект X5 Retail Group)
💰зп: вилка: 180к — 250к
📅формат работы: Удаленка (РФ)
📅занятость: Full-time
Контакт: @Natali_HRit (Наталья)
📌Задачи:
- Разработка алгоритма ранжирования PLU на основе финансовых показателей так, чтобы наш DS-модуль мог учитывать в прогнозе продаж ранее неиспользованные финансовые показатели.
- Доработка текущего алгоритма выдачи прогноза по товарам-новинкам, которые продаются менее 3х месяцев в магазинах сети - не учитываются при выдаче прогноза дальнейших продаж.
📌Обязанности
- Разработка кода и тестов на Python, участие в командной разработке, участие в код-ревью
- Проработка и изменение дизайна существующих компонент при необходимости
- Подготовка и валидация обучающих выборок данных для внедрения и сопровождения математических моделей продуктов больших данных
- Расчет результатов АБ-тестов, дизайн АБ-тестов
- Внедрение современных методов машинного обучения и анализа данных в продуктах больших данных
- Разворачивание моделей и сервисов в контуре х5 (Hadoop/K8S/AirFlow)
- Написание запросов на sql, оптимизация запросов (Spark, в частности)
- Предлагает идеи для улучшения модели/подхода
- Предлагает прокси-метрики и функции потерь, связанные с бизнес-метриками
- Контроль соответствия результатов работы менеджеров по работе с большими данными в релизах продуктов больших данных.
- Техническая реализация data-science решений на продуктах департамента.
- Формирование требований к данным для разработки математических моделей в рамках релизов продуктов больших данных.
- Анализ предметной области с целью повышения качества моделей и формирования предложений по достижению целей проектов и продуктов больших данных.
📌Требования:
- Алгоритмы и структуры данных.
- Умеет оценивать сложность алгоритмов
- Знает алгоритмы и структуры данных из стандартного курса
- Знает оценку сложности структур из для стандартной библиотеки
- Знакомство с алгоритмами из расширенного набора: вероятностные, алгоритмы во внешней памяти, алгоритмы на графах ТВиМС
- Предельные теоремы и умение их применять проверка гипотез бутстреп A/B-тесты variance reduction causal inference ML
- Понимает ML-алгоритмы и методы в области.
- Эффективно адаптирует их для решения задач при необходимости.
- Строит модели из стандартных компонент.
- Понимает шаги жизненного цикла ML-разработки и их взаимодействие в проекте, при необходимости изменяет существующий дизайн.
- Понимает, какие бизнес-метрики для модели нужно мониторить
- Может предложить прокси-метрики и функцию потерь, связанные с бизнес-метриками
- Может докатить простую модель в пилот имплементировать метод по статье встроить компонент в существующий пайплайн
- Знаком с менее распространенными методами МО (например: байесовские модели/PGM/VBI, RL и прочее). MLOps
- Разово может зафиттить модель, по запросу проверить, жива ли она, обновить развернуть какое-либо необходимое ПО в кластере версионирование моделей, данных мониторинг работы моделей, качества данных sql Простые запросы (select'ы/группировки и т.д.) Окна
- Оптимизация запросов
- Engineering
- Переводит идеи в чистый код, который будут и исполнять, и читать
- Пользуется Git'ом
- Пишет тесты
- Способен разбираться в чужом коде и эффективно его дебажить
- Базовое понимание всех компонентов архитектуры
- Использование лучших практик разработки DB&BD
- Промышленный опыт работы с несколькими системами
- Знание внутреннего устройства систем, используемых в работе оптимизация вычислений/запросов транзакции/ACID/Индексы Other
- Может декомпозировать понятные задачи
- Самостоятельно находит решение или использует существующие подходы для понятных задач
🔥Если все нравится - пиши @Natali_HRit
BY Data Science Work
Share with your friend now:
tgoop.com/datasciencework/461