Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение 6108

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

⭐ Шпаргалка из 40 методов NumPy, которые используются в 95% случаев

👾8👍4❤2❤‍🔥1

2.4K views07:10

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

📈 BI на максималках: 4 варианта ускорения реализации комплексных решений

Четыре проверенных способа сократить время реализации BI-проектов без потери функциональности. Реальный опыт backend-разработчика, который поможет вам избежать типичных ошибок при внедрении Business Intelligence.

Подробнее в нашей статье: https://proglib.io/sh/YuEShfjNiD

❤1👍1

9.4K views11:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

0:41

Media is too big

VIEW IN TELEGRAM

📊 Тренды Data Science в 2025 году

Proglib рассказывает про новости из мира анализа данных в формате рилса

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥3

2.08K views18:02

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Самые полезные каналы для программистов в одной подборке!

Сохраняйте себе, чтобы не потерять 💾

🔥Для всех

Библиотека программиста — новости, статьи, досуг, фундаментальные темы
Книги для программистов
IT-мемы
Proglib Academy — тут мы рассказываем про обучение и курсы
Азбука айтишника — здесь мы познаем азы из мира программирования

🤖Про нейросети
Библиотека робототехники и беспилотников | Роботы, ИИ, интернет вещей
Библиотека нейрозвука | Транскрибация, синтез речи, ИИ-музыка
Библиотека нейротекста | ChatGPT, Gemini, Bing
Библиотека нейровидео | Sora AI, Runway ML, дипфейки
Библиотека нейрокартинок | Midjourney, DALL-E, Stable Diffusion

#️⃣C#

Книги для шарпистов | C#, .NET, F#
Библиотека шарписта — полезные статьи, новости и обучающие материалы по C#
Библиотека задач по C# — код, квизы и тесты
Библиотека собеса по C# — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Вакансии по C#, .NET, Unity Вакансии по PHP, Symfony, Laravel

☁️DevOps

Библиотека devops’а — полезные статьи, новости и обучающие материалы по DevOps
Вакансии по DevOps & SRE
Библиотека задач по DevOps — код, квизы и тесты
Библиотека собеса по DevOps — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования

🐘PHP

Библиотека пхпшника — полезные статьи, новости и обучающие материалы по PHP
Вакансии по PHP, Symfony, Laravel
Библиотека PHP для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по PHP — код, квизы и тесты

🐍Python

Библиотека питониста — полезные статьи, новости и обучающие материалы по Python
Вакансии по питону, Django, Flask
Библиотека Python для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Python — код, квизы и тесты

☕Java

Книги для джавистов | Java
Библиотека джависта — полезные статьи по Java, новости и обучающие материалы
Библиотека Java для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Java — код, квизы и тесты
Вакансии для java-разработчиков

👾Data Science

Книги для дата сайентистов | Data Science
Библиотека Data Science — полезные статьи, новости и обучающие материалы по Data Science
Библиотека Data Science для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Data Science — код, квизы и тесты
Вакансии по Data Science, анализу данных, аналитике, искусственному интеллекту

🦫Go

Книги для Go разработчиков
Библиотека Go разработчика — полезные статьи, новости и обучающие материалы по Go
Библиотека Go для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Go — код, квизы и тесты
Вакансии по Go

🧠C++

Книги для C/C++ разработчиков
Библиотека C/C++ разработчика — полезные статьи, новости и обучающие материалы по C++
Библиотека C++ для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по C++ — код, квизы и тесты
Вакансии по C++

💻Другие каналы

Библиотека фронтендера
Библиотека мобильного разработчика
Библиотека хакера
Библиотека тестировщика
Вакансии по фронтенду, джаваскрипт, React, Angular, Vue
Вакансии для мобильных разработчиков
Вакансии по QA тестированию
InfoSec Jobs — вакансии по информационной безопасности
Библиотека разработчика игр | Gamedev, Unity, Unreal Engine

📁Чтобы добавить папку с нашими каналами, нажмите 👉сюда👈

Также у нас есть боты:
Бот с IT-вакансиями
Бот с мероприятиями в сфере IT

Мы в других соцсетях:
🔸VK
🔸YouTube
🔸Дзен
🔸Facebook *
🔸Instagram *

* Организация Meta запрещена на территории РФ

👍1

1.97K views06:02

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

💡 Лайфхак: если столбчатая диаграмма слишком загромождена, замените её точечным графиком или пузырьковой диаграммой.

Так данные будут чище и нагляднее!

👍17🔥2🥰1

2.11K views07:05

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🚀 Data Formulator: AI для визуализации данных

Microsoft Research представили Data Formulator — инструмент, который использует ИИ для быстрого преобразования данных и создания визуализаций.

🔹 Комбинирует ввод через UI и естественный язык
🔹 Облегчает настройку графиков
🔹 Автоматизирует преобразование данных

Ссылка на проект: https://clc.to/CXVyBw

❤1🎉1

2.32K views18:03

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

📌 Методы машинного обучения и их параметры

Делимся подборкой основных методов ML и ключевых параметров, которые влияют на их работу.

👍7❤1

2.22K views07:05

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

📊 Как себя чувствует IT-рынок в 2025 году?

Друзья, запускаем важное исследование рынка труда в IT!

Нам очень важно понять:
• Как изменились зарплаты
• Что происходит с наймом
• Есть ли сокращения или рост

🔐 Опрос полностью анонимный
⏱️ Займёт всего 3-5 минут
📈 Результаты опубликуем в подробной статье

Ваши ответы помогут составить реальную картину происходящего в индустрии.

👉 Пройти опрос (https://docs.google.com/forms/d/e/1FAIpQLSd4V4ESNVRL4w6iYaYqLS2LEL0YW-VmILvs0_43qYvvnte5iw/viewform)

😁1💯1

2.1K views11:04

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🐳 Делаем конкурента DeepSeek R1-Zero на домашней пекарне: метод GRPO в Unsloth

Обычно LLM требуют мощных GPU, но теперь даже на видеокарте с ограниченной памятью можно обучать модели логического рассуждения.

💡 Фишка — новый алгоритм GRPO, который позволяет моделям развивать логическое мышление без вмешательства человека.

Подробнее в нашей статье: https://proglib.io/sh/MyBCbq9is5

❤2

25.5K views15:01

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

3:40

This media is not supported in your browser

VIEW IN TELEGRAM

💘 14 февраля: песня о любви… от нейросети

Лучшее, что можно сделать в День всех влюбленных? Конечно, признаться в любви… к своей работе! ❤️

Мы предсказываем будущее, строим модели, оживляем нейросети — без нас мир был бы совсем другим! Чтобы отпраздновать этот день, мы попросили ИИ написать гимн всех дата-сайентистов. И вот что получилось:

«В потоке данных я как супергерой,
Собираю инсайты одной рукой»

🎧 Включайте видео и заряжайтесь вдохновением!

А за что вы любите (или не очень) свою работу? Делитесь в комментариях! ⬇️

🔥4❤2👍2

2.29K viewsedited 08:02

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

📊 ETL, ELT и EtLT — в чём разница?

Если эти аббревиатуры кажутся вам загадочным шифром, давайте разбираться!

🔹 ETL (Extract, Transform, Load) — сначала преобразуем, потом загружаем.
✅ Высокое качество данных, экономия места.
❌ Долго, сложно менять трансформации.

🔹 ELT (Extract, Load, Transform) — сначала загружаем, потом трансформируем.
✅ Гибкость, скорость.
❌ Дороже, требует сильного хранилища, ошибки обнаруживаются позже.

🔹 EtLT (Extract, tiny Load, Transform) — компромисс между первыми двумя.
✅ Оптимальный баланс скорости и качества, фильтрация мусора на ранних этапах.
❌ Сложнее в реализации, мало инструментов.

Какой метод используете вы?

👍6❤3

2.58K views18:12

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

👉 Что такое Preswald?

Preswald — это полнофункциональная платформа для создания, развертывания и управления интерактивными дата-приложениями. Она объединяет загрузку, хранение, обработку и визуализацию данных в одном мощном и лёгком SDK.

🔹 Простота кода — минимум Python и SQL для создания мощных приложений
🔹 Полный цикл — от ETL до визуализации в одной платформе
🔹 Эффективность — убирает лишнюю сложность, сохраняя гибкость

Ссылка на проект: https://clc.to/JyyQfw

👍3❤1

2.05K views07:05

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

⚠️ В машинном обучении, как в любви: слишком идеальные предсказания – это подозрительно!

Когда модель слишком прилипчива к тренировочным данным, результат оказывается… ну, как в отношениях, когда всё кажется идеальным, но реальность ломает сердце.

❌ Оверфиттинг (Overfitting) – модель так хорошо запомнила тренировочные данные, что на реальных данных начинает путаться.
💔 В любви: «Я выбрал идеального партнёра по профилю, а в жизни выяснилось, что его «идеальность» – всего лишь иллюзия!»

❌ Андерфиттинг (Underfitting) – модель обучена настолько поверхностно, что предсказывает мэтчи случайным образом.
💔 В любви: «Мне нравятся только люди с именем Александр, а всех остальных я даже не замечаю – бедный фильтр!»

❌ Неправильный выбор фичей (Feature Selection Fail) – если модель опирается на неважные признаки, она предсказывает мэтчи хуже случайности.
💔 В любви: «Ты любишь авокадо? Значит, мы созданы друг для друга!» – а потом оказывается, что это вовсе не про важное.

🎯 На вебинаре мы разобрали, как избежать этих ошибок и создать работающую модель для speed dating, которая на самом деле помогает находить любовь! Вчера мы не просто говорили о любви – мы её предсказывали!

🔥 Спасибо всем, кто был с нами и участвовал!

💘 Как же это было?

Если ты пропустил вебинар или хочешь пересмотреть запись – просто перейди по [ссылке] и получи видео 😉

❤4😁1

2.04K views15:01

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

😴 Скучно на выходных?

Что, если построить свою библиотеку машинного обучения с чистого листа — только с Python, NumPy и математическими формулами?

ML by Hand — библиотека, которая помогает понять, как работают нейросети изнутри. С её помощью можно обучить модели от CNN и LSTM до GPT без готовых фреймворков.

✅ Проект вдохновлён Micrograd Андрея Карпатого и идеально подойдёт тем, кто хочет разобраться в глубинной математике ИИ.

🔗 Код и подробности: https://clc.to/M2buLg

👍4😁3

2.21K views18:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🔥 4 стратегии обучения на нескольких GPU

При обучении нейросетей важно эффективно распределять нагрузку между видеокартами. Разберем четыре ключевых подхода к параллелизации:

Model Parallelism — разделение слоев модели между GPU. Каждый GPU обрабатывает свою часть сети (например, слой 1 на первом GPU, слой 2 — на втором).
✅ Подходит для очень больших моделей
❌ Сложно синхронизировать вычисления

Tensor Parallelism — разделение нейронов внутри слоя. Один и тот же слой делится между несколькими GPU.
✅ Используется в современных LLM (GPT, LLaMA)
❌ Требует сложных алгоритмов коммуникации

Data Parallelism — разбиение данных. Одна и та же модель копируется на каждый GPU, но обучается на разных мини-батчах.
✅ Простой в реализации
❌ Ограничен размером батча

Pipeline Parallelism — послойная обработка данных. Данные передаются через несколько GPU по конвейеру.
✅ Подходит для глубоких моделей
❌ Может быть простой (idle time) между шагами

❤5👍2

2.18K views07:06

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

✅ Ожидание: Чёткий план, логичный перебор параметров.
😵‍💫 Реальность: Бесконечный хаос, случайные комбинации и надежда на лучшее.

😁17💯1

2.11K views18:03

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Shuffle Feature Importance: простая методика оценки важности признаков

Shuffle Feature Importance — интуитивно понятный метод оценки значимости признаков в модели машинного обучения. Он основан на анализе того, насколько ухудшается качество модели после случайного перемешивания значений конкретного признака.

Как это работает:
▪️ Обучение модели и оценка её качества (P₁) на исходных данных.
▪️ Перемешивание одного признака (shuffle) и повторная оценка качества модели (P₂).
▪️ Расчёт важности признака: разница между исходным и новым качеством модели (P₁ — P₂).
▪️ Повторение процедуры для всех признаков, чтобы получить сравнительную значимость.

📊 Чем сильнее падает качество после перемешивания, тем важнее признак для модели!

👍8❤2🎉1

2.11K views07:04

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

✨ smolmodels — машинное обучение на естественном языке

Библиотека для создания моделей машинного обучения с минимальным кодом. Просто опишите задачу словами — smolmodels выполнит всё остальное: от генерации данных до обучения и упаковки модели.

Основные возможности:
✔️ Автоматическая генерация данных
✔️ Feature engineering без ручного вмешательства
✔️ Обучение модели на основе текстового описания
✔️ Упаковка готовой модели для использования

Ссылка: https://clc.to/_tBBWg

👍3👏2❤1

2.11K views18:02

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

❗Вакансии «Библиотеки программиста» — ждем вас в команде!

Мы постоянно растем и развиваемся, поэтому создали отдельную страницу, на которой будут размещены наши актуальные вакансии. Сейчас мы ищем:
👉контент-менеджеров для ведения телеграм-каналов
👉Переводчик и автор оригинальных статей

Подробности тут

Мы предлагаем частичную занятость и полностью удаленный формат работы — можно совмещать с основной и находиться в любом месте🌴

Ждем ваших откликов 👾

job.proglib.io

Вакансии в медиа «Библиотека программиста»‎

Количество проектов в редакции постоянно растет, так что нам всегда нужны специалисты

1.91K views06:02

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

R²: высокое значение ≠ хорошие прогнозы

R² (коэффициент детерминации) показывает, какая доля изменчивости зависимой переменной объясняется моделью.

✅ R² = 0 → Модель не объясняет данные → Плохая предсказательная способность.
✅ R² = 1 → Полное соответствие данным → Возможен оверфит.

⚠️ Главное заблуждение: высокий R² не гарантирует точных прогнозов, а лишь оценивает, насколько модель подогнана под данные.

Формула:
R² = 1 — (RSS / TSS),
где TSS — общая изменчивость, RSS — ошибка модели.

👍7❤1

2.09K viewsedited 07:03

2025/07/08 17:58:28
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>