#дайджест #DataInternship
Подборка стажировок недели для Data специалистов
▪️ Data Engineer/Дата инженер (ученик)
Офис (Москва, Санкт-Петербург, Тольятти, Самара, Казань, Ростов-на-Дону, Сочи, Екатеринбург), Aston
Подробнее
▪️ Стажер Data Analyst
Офис (Москва), Wildberries
Подробнее
▪️ Стажер Data science (Дирекция цифрового развития)
Офис (Москва), Банк Русский Стандарт
Подробнее
▪️ Аналитик данных (стажёр)
Офис (Москва), RRT
Подробнее
▪️ Стажёр-data scientist [FDP]
Офис (Москва), МТС
Подробнее
Понравились предложения о стажировке?
❤️ — да
🤔 — нет
Подборка стажировок недели для Data специалистов
▪️ Data Engineer/Дата инженер (ученик)
Офис (Москва, Санкт-Петербург, Тольятти, Самара, Казань, Ростов-на-Дону, Сочи, Екатеринбург), Aston
Подробнее
▪️ Стажер Data Analyst
Офис (Москва), Wildberries
Подробнее
▪️ Стажер Data science (Дирекция цифрового развития)
Офис (Москва), Банк Русский Стандарт
Подробнее
▪️ Аналитик данных (стажёр)
Офис (Москва), RRT
Подробнее
▪️ Стажёр-data scientist [FDP]
Офис (Москва), МТС
Подробнее
Понравились предложения о стажировке?
❤️ — да
🤔 — нет
❤4
✏️ Разбор задачи с экзамена ШАД
Условие: Линейный оператор φ действует на пространстве многочленов степени не выше 2 с вещественными коэффициентами. Известно, что 1️⃣. Найдите сумму действительных собственных значений оператора φ (сумму следует вычислять с учетом алгебраической кратности собственных значений).
Подсказка:Найдите матрицу данного оператора и её характеристический многочлен.
Решение: Матрица Φ данного оператора в базисе x^2,x,1 удовлетворяет уравнению AΦ^T = B где 2️⃣ откуда 3️⃣ поэтому 4️⃣. Это и есть ответ, так как все собственные значения матрицы Φ^T вещественные. Это следует из того, что ее характеристический многочлен 5️⃣ имеет 3 действительных корня, так как f(0)>0, f(1)<0.
#задачи_шад
Условие: Линейный оператор φ действует на пространстве многочленов степени не выше 2 с вещественными коэффициентами. Известно, что 1️⃣. Найдите сумму действительных собственных значений оператора φ (сумму следует вычислять с учетом алгебраической кратности собственных значений).
Подсказка:
Решение: Матрица Φ данного оператора в базисе x^2,x,1 удовлетворяет уравнению AΦ^T = B где 2️⃣ откуда 3️⃣ поэтому 4️⃣. Это и есть ответ, так как все собственные значения матрицы Φ^T вещественные. Это следует из того, что ее характеристический многочлен 5️⃣ имеет 3 действительных корня, так как f(0)>0, f(1)<0.
#задачи_шад
❤1
🤼 Генеративно-состязательная нейросеть: ваша первая GAN-модель на PyTorch
Подробная инструкция построения генеративно-состязательных нейросетей (GAN) на примере двух моделей, реализованных с помощью фреймворка глубокого обучения PyTorch в нашей статье.👇
🔗 Статья
У нас есть курс как для начинающих программистов, так и для тех, кто уже шарит:
🔵 Алгоритмы и структуры данных
Подробная инструкция построения генеративно-состязательных нейросетей (GAN) на примере двух моделей, реализованных с помощью фреймворка глубокого обучения PyTorch в нашей статье.
🔗 Статья
У нас есть курс как для начинающих программистов, так и для тех, кто уже шарит:
Please open Telegram to view this post
VIEW IN TELEGRAM
🙏3
Что такое KNN в машинном обучении
KNN (K-Nearest Neighbors) — это один из простейших и интуитивно понятных методов машинного обучения для решения задач классификации и регрессии. Его суть заключается в том, чтобы искать "соседей" объекта и предсказывать его класс на основе классов этих соседей.
🌻 Как это работает?
▪️ Поиск соседей: Для каждого нового объекта KNN ищет K ближайших соседей на основе выбранной метрики расстояния (например, Евклидово расстояние)
▪️ Голосование: В случае классификации объект относится к тому классу, который преобладает среди его соседей
▪️ Усреднение: В задачах регрессии предсказание для объекта — это среднее значение его соседей
🌻 Когда использовать?
KNN полезен, когда данные относительно простые и их не слишком много, так как метод требует много вычислительных ресурсов при больших объемах данных. Его часто применяют в задачах, где важна интерпретируемость и легкость реализации.
В нашем курсе узнаете подробнее о машинном обучении, в частности, о бустинге:
🔵 Базовые модели ML и приложения
#машинное_обучение
KNN (K-Nearest Neighbors) — это один из простейших и интуитивно понятных методов машинного обучения для решения задач классификации и регрессии. Его суть заключается в том, чтобы искать "соседей" объекта и предсказывать его класс на основе классов этих соседей.
▪️ Поиск соседей: Для каждого нового объекта KNN ищет K ближайших соседей на основе выбранной метрики расстояния (например, Евклидово расстояние)
▪️ Голосование: В случае классификации объект относится к тому классу, который преобладает среди его соседей
▪️ Усреднение: В задачах регрессии предсказание для объекта — это среднее значение его соседей
KNN полезен, когда данные относительно простые и их не слишком много, так как метод требует много вычислительных ресурсов при больших объемах данных. Его часто применяют в задачах, где важна интерпретируемость и легкость реализации.
В нашем курсе узнаете подробнее о машинном обучении, в частности, о бустинге:
#машинное_обучение
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Не можете решить — тогда подтягивайте свои знания с помощью нашего курса:
Please open Telegram to view this post
VIEW IN TELEGRAM
proglib.academy
Программирования на Python
Онлайн курс от «Библиотеки программиста» для новичков и начинающих разработчиков | Старт карьеры за 1,5 мес | 5 проектов в портфолио | Карьерная поддержка, помощь с написанием резюме | Бесплатное демо | Сообщество из 800 000 разработчиков
Forwarded from Библиотека задач по Python | тесты, код, задания
Forwarded from Библиотека задач по Python | тесты, код, задания
🔥3
Многое могло останавливать вас на пути к началу карьеры: страхи, мифы, предрассудки. Сегодня развеем 5 основных мифов о стажировках и продолжаем вас мотивировать делать первые шаги!
Да, временами бывает сложно, но это вовсе не невозможно. Компании часто идут навстречу, предлагают парт-тайм с занятостью 20 часов в неделю. Есть и летние стажировки как раз на время каникул. Кроме того, реальная занятость не всегда составляет полные 40 часов — нередко это 2-3 часа активной работы, остальное — созвоны и всякие рабочие мелочи.
Многие считают, что попасть можно только если ты мега-звезда. На деле стажировки есть в компаниях, где отбор менее напряжен. Кстати, попасть в бигтехи тоже не обязательно зависит от лотереи или жесткого отбора. Есть обходные пути, например, работа в мелких проектах или стажировка в дочерних компаниях.
Да, обычно оплата стажировок небольшая. Но вообще стажировки лучше рассматривать как шаг в обучении, а не источник больших заработков.
Очередной миф. Конечно, во многом они проводятся именно в мегаполисах, но если вы живете в другом городе, вы сможете найти варианты: просить жилье, снимать комнату или работать дистанционно. До пандемии это было менее популярно, но сейчас очень много компаний с удовольствием берут на работу дистантом.
Нет, опыт работы для стажировок не требуется, хотя он и может повысить ваши шансы. Что понадобится — проделанные проекты и практика. Начинайте с пет проектов, их полно на GitHub или на курсах. Не относитесь к ним как к способу удивить рекрутеров, а разглядывайте их как важную часть вашего обучения.
Показали вам, что стажировка может стать отличным шагом вперед для вашей карьеры. Отбросьте страхи и попробуйте — может, вы уже на пороге своего первого крупного успеха?
Хотите подтянуть знания для стажировки? Тогда подтяните программирование:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Мечтал стать востребованным специалистом в Data Science и работать над реальными проектами
— Выпускник Proglib.academy в карточке делится своим мнением о курсе.👆
➡️ Интенсивное обучение с теоретическими видеоуроками и практическими задачами.
Курс охватывает школьную математику, линейную алгебру, математический анализ и комбинаторику, и адаптирован для тех, кто хочет перейти в Data Science или подготовиться к собеседованиям в топовые компании.
Поддержка менторов и обратная связь по домашним заданиям помогают усвоить материал и повысить квалификацию.
Хотите повторить путь Артёма — забирайте наш курс:
🔵 Математика для Data Science
— Выпускник Proglib.academy в карточке делится своим мнением о курсе.
Курс «Математика для Data Science» от Proglib Academy
Курс охватывает школьную математику, линейную алгебру, математический анализ и комбинаторику, и адаптирован для тех, кто хочет перейти в Data Science или подготовиться к собеседованиям в топовые компании.
Поддержка менторов и обратная связь по домашним заданиям помогают усвоить материал и повысить квалификацию.
Хотите повторить путь Артёма — забирайте наш курс:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Хотите изучать Data Science с нуля или прокачать свои навыки, но не знаете, с чего начать: Toward.ai — это ресурс, где можно найти множество полезных бесплатных статей на тему анализа данных, машинного обучения.
Начни сегодня, получать знания для своего будущего вместе с нашим курсом:
Please open Telegram to view this post
VIEW IN TELEGRAM
Какая подпись больше подходит?
🌚 — Когда просто зашел почиллить, а тебя случайно на работу взяли
😁 — Ну вот и настал момент, когда лень оформилась как скилл
🤔 — Резюме года
#memes
😁 — Ну вот и настал момент, когда лень оформилась как скилл
#memes
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8🤔8🌚5
Вот подборка книг для изучения Data Science.
Начать бывает сложно и пугает английский, но эти книги помогут разобраться в основах и понять ключевые концепции. Если у вас есть вопросы или нужны рекомендации, пишите в комментариях — давайте учиться вместе
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤1
Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
This media is not supported in your browser
VIEW IN TELEGRAM
🐼 PandasAI — библиотека для исследования данных с помощью естественного языка
Где использовать:
▪️ в Jupyter ноутбуках,
▪️ Streamlit-приложениях,
▪️ в виде REST API.
Как использовать: Просто формулировать вопросы к данным на естественном языке.
🔗 Демо в Google Colab
🔗 Репозиторий проекта
Где использовать:
▪️ в Jupyter ноутбуках,
▪️ Streamlit-приложениях,
▪️ в виде REST API.
Как использовать: Просто формулировать вопросы к данным на естественном языке.
🔗 Демо в Google Colab
🔗 Репозиторий проекта
👍3
Многие считают, что попасть на стажировку в Яндекс почти нереально. Да, этапов много, и уровень задач может показаться сложным. Но давайте разберемся:
Задания обновляются каждые полгода. Для подготовки можно решить прошлые задачи. С каждым годом набор стажеров растет, и иногда даже 1/3 решенных задач хватает, но лучше ориентироваться на 2/3
Задачи по математике, логике, вероятностям и программированию. Уровень easy-medium, но все решаемо. Перед собесом повторите базовые темы: комбинаторика, мат. ожидание, бинарный поиск, SQL. Если идете в ML, могут задать вопросы по основам машинного обучения. Главное — не только решить задачу, но и показать умение общаться.
Обычно одна задача уровня medium с LeetCode. Основные темы: бинарный поиск, префиксные суммы, два указателя, хеш-таблицы. Если не очень сильны в алгоритмах, лучше сосредоточьтесь на самых частых задачах.
Тут важно показать себя как человека, с которым будет комфортно работать. Подготовьте самопрезентацию, расскажите о своих проектах и интересах. Главное — быть собой и задавать вопросы команде.
В общем, всё достаточно прозрачно и реально.
Хотите подтянуть знания для стажировки? Тогда забирайте курс по машинному обучению:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Разбираемся с написанием правильного CSS:
Используйте препроцессоры, постпроцессоры, линтеры. Первые помогут избавиться от повторяющегося кода, писать стили более осмысленно. Вторые оптимизируют код, а третьи помогут соблюдать стандарты кодирования.
Фреймворки, такие как Bootstrap, — это мощный инструмент. Однако он может замедлять загрузку страницы из-за своей тяжеловесности. Если требуется только часть функциональности фреймворка, можно скомпилировать лишь необходимые компоненты.
При использовании препроцессоров рекомендуется разделять стили на отдельные файлы. Препроцессор объединит их при компиляции, создавая единый CSS-файл с структурированными стилями.
В каждом проекте есть повторяющиеся элементы, такие как цвета, отступы и шрифты. Эти настройки лучше всего вынести в отдельный файл переменных, используйте возможности препроцессоров.
Использование методологий, таких как объектно-ориентированный CSS (OOCSS), помогает структурировать код. Например, разделение структурных и визуальных стилей позволяет избежать дублирования и упрощает поддержку проекта в будущем.
Изучите основы Frontend'а вместе с нашим курсом:
Please open Telegram to view this post
VIEW IN TELEGRAM
🙏1
Forwarded from Библиотека собеса по Data Science | вопросы с собеседований
Какие вы знаете автоматические способы обнаружения выбросов в датасете?
Вот несколько подходов:
▪️Isolation forest
Метод базируется на алгоритме случайного леса. Его основная идея заключается в том, что выбросы легче изолировать от остальных данных, чем нормальные объекты. В процессе работы алгоритм строит деревья, случайно разделяя данные. Выбросы, как правило, изолируются за меньшее число шагов. В результате каждому объекту присваивается скор от 0 до 1, где значения, близкие к 1, указывают на возможные выбросы, а значения, близкие к 0, означают нормальные данные.
▪️Local Outlier Factor (LOF)
Этот метод оценивает, насколько плотно объект окружен своими соседями по сравнению с плотностью соседей вокруг других объектов. Если плотность точки значительно меньше, чем у её соседей, то точка считается выбросом.
▪️Расстояние Махаланобиса
Этот метод измеряет расстояние между точкой и средним значением распределения, принимая во внимание ковариацию данных. Точки, находящиеся далеко от центра распределения, но с учётом их корреляции с другими признаками, могут быть идентифицированы как выбросы.
#машинное_обучение
#данные
Вот несколько подходов:
▪️Isolation forest
Метод базируется на алгоритме случайного леса. Его основная идея заключается в том, что выбросы легче изолировать от остальных данных, чем нормальные объекты. В процессе работы алгоритм строит деревья, случайно разделяя данные. Выбросы, как правило, изолируются за меньшее число шагов. В результате каждому объекту присваивается скор от 0 до 1, где значения, близкие к 1, указывают на возможные выбросы, а значения, близкие к 0, означают нормальные данные.
▪️Local Outlier Factor (LOF)
Этот метод оценивает, насколько плотно объект окружен своими соседями по сравнению с плотностью соседей вокруг других объектов. Если плотность точки значительно меньше, чем у её соседей, то точка считается выбросом.
▪️Расстояние Махаланобиса
Этот метод измеряет расстояние между точкой и средним значением распределения, принимая во внимание ковариацию данных. Точки, находящиеся далеко от центра распределения, но с учётом их корреляции с другими признаками, могут быть идентифицированы как выбросы.
#машинное_обучение
#данные
👍1