Telegram Web
🙌 Agents 101: Ваш первый ИИ-агент за 30 минут — это реально

Создание собственного агента может показаться непростой задачей: куча концепций, фреймворков и практик, которые нужно освоить.

Но не переживайте — мы нашли простой способ добавить агента в ваше приложение.

Подробный туториал уже ждет вас по ссылке: https://clc.to/P-6evQ
3👍3
📍 Введение в программирование на CUDA для Python-разработчиков

Современные GPU содержат тысячи ядер, способных обрабатывать огромные объемы данных параллельно. В отличие от CPU, выполняющего несколько сложных задач последовательно, GPU идеально подходят для задач, требующих массовых вычислений, таких как машинное обучение, обработка изображений и симуляции.

В этой статье вы узнаете:
Как устроены GPU и чем они отличаются от CPU
Что такое CUDA и как она позволяет программировать GPU
Как PyTorch, TensorFlow и JAX скрывают сложность работы с CUDA
Простой пример работы с CUDA в Python

🔗 Читать статью: https://clc.to/DWE_Ag
🔥21👍1
💾 10 способов работы с большими файлами в Python, о которых ты не знал

Годнота для всех, кто работает с данными. Статья раскрывает разные подходы к обработке больших файлов — от простых итераторов до распределенных вычислений.

👍 Сохраняй себе, точно пригодится в работе: https://proglib.io/sh/VOcgo7w0W1
1
😱 10 Python-библиотек, которые изменят ваш Data Science

Python для Data Science — это не только Pandas и NumPy! В нашей статье — 10 скрытых библиотек, которые ускорят работу с большими данными, автоматизируют ML и улучшат визуализацию.

Быстрые альтернативы Pandas (Dask, Modin, Polars, Datatable)
AutoML для моделей (PyCaret, H2O.ai)
Упрощение трансформаций (Fugue)
Умная визуализация (Sweetviz, Lux)

Ссылка на сборник библиотек: https://clc.to/ibe2ew
1
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
👍1
🎬 Предсказываем ваш следующий любимый фильм с NetworkX, Jaccard Similarity и cuGraph

В мире, переполненном данными, делать осознанный выбор становится сложнее. К счастью, рекомендательные системы помогают упростить этот процесс, используя мощь графов.

Почему графы?
Они отлично моделируют связи между объектами, а NetworkX — популярный инструмент для графового анализа в Python. Он удобен, богат алгоритмами и имеет активное сообщество.

Но есть проблема — NetworkX не справляется с большими масштабами данных, которые нужны для рекомендаций.

Можно ли создать эффективную рекомендательную систему на графах в несколько строк кода, сочетая удобство и высокую производительность?

💡 Ответ ищите в статье: https://clc.to/hE8VPA
3👍3
🤔 Основы математики в Machine Learning / Deep Learning

🗓 6 марта приглашаем вас на прямой эфир, где мы подробно разберем ряд Тейлора, собственные векторы и другие ключевые понятия в ML.
(ссылка)

🌟 Спикер: *Мария Горденко* – Старший преподаватель ФКН НИУ ВШЭ, НИТУ МИСИС, аспирант департамента анализа данных и искусственного интеллекта ФКН НИУ ВШЭ, а также преподаватель на курсе Алгоритмы и структуры данных в proglib academy.


Место работы: Инженер-программист, ведущий эксперт НИУ ВШЭ, цифровой ассистент и цифровой консультант НИУ ВШЭ.


😮 На вебинаре вы узнаете:

🔵 Теорию вероятностей: обсудим случайные величины, вероятность, математическое ожидание и дисперсию.

🔵 Линейную алгебру: изучим векторы, матрицы, собственные векторы и собственные значения.

🔵 Математический анализ: разберем производные и разложение функций в ряд Тейлора.

🔵 Практику: применим полученные знания на реальных кейсах из области Machine Learning и Deep Learning.

🎯 Почему это важно?
Понимание математических основ помогает глубже разобраться в работающих под капотом алгоритмах ML/DL и эффективно применять их на практике.

👉 Присоединяйтесь к нам и совершенствуйте свои навыки в машинном обучении!

📌 Регистрация по ссылке: https://proglib.io/w/6693dce7
👍1
Гессиан больше не нужен! Упрощаем оценку неопределённостей в ML.

Оценка неопределённости в нейросетях — важная, но вычислительно затратная задача. В недавнем исследовании, показано, что традиционные методы на основе Гессиана не только требовательны к ресурсам, но и порой неточны.

Что предложено:
Заменяем Гессиан на единичную матрицу в аппроксимации Лапласа
Улучшаем определение выбросов в данных
Достигаем точности на уровне небайесовских методов

Как это работает? Читайте в статье: https://clc.to/yxJ1sQ
👍32🤔1
🦆 Освоение DuckDB для тех, кто привык к pandas или Polars

Вы, возможно, слышали о впечатляющей надежности и производительности DuckDB. Возможно, вы хотите его попробовать, НО ПОГОДИТЕ! Вы — дата-сайентист и привыкли к pandas или Polars, а не к SQL. Вы умеете пользоваться SELECT, JOIN и GROUP BY, но не многим больше.

И теперь у вас вопрос: возможно ли использовать SQL для выполнения таких задач, как:

✔️ Центрирование переменной (т.е. вычитание её среднего значения)?
✔️ Ресемплирование по времени?
✔️ Вычисление скользящих статистик?

Не только возможно, но и довольно просто! Давайте разберёмся, как реализовать основные операции с датафреймами в SQL.
👍81
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 Топ-5 библиотек для объяснения ML моделей

🟢 SHAP (Shapley Additive Explanations)
Один из самых популярных методов объяснения модели на основе вкладов признаков.

🟢 LIME (Local Interpretable Model-agnostic Explanations)
Модель-агностичный подход, который обучает локальную интерпретируемую модель вокруг конкретного предсказания.

🟢 Eli5 (Explain Like I’m Five)
Упрощённое объяснение сложных ML-моделей, поддержка scikit-learn, Keras и других фреймворков.

🟢 AI Explainability 360 (AIX360)
Библиотека от IBM для объяснения моделей на различных типах данных: табличных, текстовых, изображениях и временных рядах.

🟢 InterpretML
Инструмент от Microsoft, который включает как интерпретируемые «прозрачные» модели, так и объяснители для «чёрных ящиков».
🔥6👍31
TSFRESH: автоматическое извлечение признаков из временных рядов

📌 TSFRESH (Time Series Feature extraction based on scalable hypothesis tests) — это мощная библиотека для автоматического извлечения признаков из временных рядов.

🔹 Использует алгоритмы из статистики, анализа временных рядов, обработки сигналов и нелинейной динамики.
🔹 Позволяет анализировать не только временные ряды в классическом понимании, но и любые последовательности событий.
🔹 Включает встроенный механизм отбора релевантных признаков.

Ссылка на проект: https://clc.to/TntpNw
👍71
🚀 Что должны уметь супергерои Data Science?

Data Science — это такая область, где требуется баланс между программированием, математикой и исследовательской работой. В разных компаниях ожидания от дата-саентистов могут сильно различаться: кто-то требует глубоких знаний в математике, а кто-то больше акцентирует внимание на навыках разработки. В любом случае, хороший код — это основа работы каждого супергероя DS.

Хотите узнать, как развивать навыки дата-саентиста, работать с командой и интегрировать решения с коммерческой и продуктовой разработкой?

Ответ в статье: https://clc.to/3o7TpA
1
Как вычислить Softmax без переполнения?

Вычисление Softmax связано с экспонентами, которые могут вызывать числовые ошибки и переполнение. Особенно при больших входных значениях.

📌 Что делать? Подробнее на картинке.
👍104🔥2
2025/07/10 08:14:56
Back to Top
HTML Embed Code: