Telegram Web
Как провести выходные с пользой? Вместо сериалов попробуйте сайт Datalemur

Здесь собраны задачи по SQL, статистике, машинному обучению и Python, которые часто встречаются на интервью в крупных IT-компаниях.

🐒 Задачи по SQL, чтобы найти, сколько бананов съели лемуры.
🤖 Кейсы по машинному обучению для прогнозирования количества чашек кофе до дедлайна.
📊 Уравнения по статистике, чтобы понять, хватит ли одной пиццы на всю команду.

Платформа помогает прокачать навыки и подготовиться к интервью.

Чтобы начать, заварите чай, зайдите на сайт, выберите категорию задач и погружайтесь в мир аналитики. Это отличный способ провести время с пользой, даже если не планируете менять работу.

#АналитикаДанных #FAANG #Интервью #Задачи
6👍4
🧹 Cleanlab — инструмент, который поможет очистить данные

📊 Этот пакет отлично работает с реальными «грязными» данными. Cleanlab использует существующие модели, чтобы находить и исправлять ошибки в данных, позволяя обучать ещё более точные и надёжные модели.

Проект

#ЧисткаДанных
👍51🤩1
📊 Что такое большие данные, как их классифицируют и какими характеристиками обладают

Рассказываем об основных терминах, методах и инструментах, которые используются при анализе больших данных.

🔗 Читать статью

🔵 А чтобы еще больше погрузиться в Big Data, забирайте наш курс «Базовые модели ML и приложения»
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🎨 Создавайте датасеты за секунды прямо в Jupyter

Представляем библиотеку Python — drawdata, которая позволяет визуализировать и создавать датасеты буквально за три строки кода.

📊 Это невероятно полезный инструмент для разработчиков, работающих с данными.

Пример:
python from drawdata import ScatterWidget widget = ScatterWidget() widget 


Библиотеку создал и поддерживает Vincent D. Warmerdam, автор множества других полезных инструментов.

🌟 Ознакомьтесь с репозиторием и поставьте звезду: github

#Python #DataScience #Jupyter #ВизуализацияДанных #Разработка
🔥12👍41
🌍 50 ведущих экспертов ИИ 2025 года

От ИИ и машинного обучения до устойчивого развития — эти эксперты делают цифровую трансформацию доступной для всех. В этом списке нет крупных корпораций, только настоящие лидеры мнений и создатели контента.

Список

👀 А вы уже следите за кем-то из этого списка? Поделитесь!

#ИскусственныйИнтеллект #БудущееТехнологий
👍2🔥1
8 курсов от NVIDIA, которые стоит изучить

Generative AI Explained
🔹 Как работает генеративный ИИ
🔹 Применения и проблемы генеративного ИИ

AI for All: From Basics to GenAI Practice
🔹 Влияние ИИ на здравоохранение и автономные системы
🔹 Применение генеративного ИИ

Getting Started with AI
🔹 Сбор и разметка данных для моделей классификации
🔹 Обучение нейронной сети

Building A Brain in 10 Minutes
🔹 Как нейросети обучаются на данных
🔹 Математика нейронов в простых примерах

Building Video AI Applications
🔹 Создание видеопотоков с помощью DeepStream
🔹 Обработка нескольких потоков видео

Building RAG Agents with LLMs
🔹 Масштабируемое развертывание LLM
🔹 Использование LangChain для управления диалогами

Accelerate Data Science Workflows with Zero Code Changes
🔹 Ускорение обработки данных с помощью GPU
🔹 Преимущества унифицированных CPU и GPU потоков

Introduction to AI in the Data Center
🔹 Основы ИИ и архитектура GPU
🔹 Развертывание AI-инфраструктуры
🔹 AI-кластеры
6👍1
DeepSeek представляет новую открытую модель DeepSeek-R1

DeepSeek выпустили модель DeepSeek-R1, которая способна конкурировать с OpenAI-o1 в задачах математики, программирования и рассуждений. Модель распространяется под лицензией MIT, что позволяет свободно модифицировать, использовать и коммерциализировать.

😊 Меньшие версии модели превосходят GPT-4o и Claude-3.5-Sonnet в отдельных бенчмарках.
📊 Результаты API теперь можно использовать для fine-tuning и дистилляции.
💰 Доступны конкурентные цены на использование API.

Подробности
📈 DeepSeek-R1 достигает 97,3% на MATH-500 и 79,8% на AIME 2024.
🤖 Модель обучена с использованием многоступенчатого подхода: RLHF (обучение с подкреплением) и supervised дообучение.
🛠️ Доступны шесть версий модели — от 1,5B до 70B параметров для разных задач.

Ссылка
🔥42👍2
✌️ Открытая редакция: ищем авторов для рубрики DevLife

Друзья, нас часто спрашивают про публикацию материалов о личном опыте и знаниях в IT. Пора это систематизировать!

Если у вас есть история о том, как вы:
📈 выросли в профессии
💡 освоили новые технологии
🚀 сделали крутой карьерный скачок
🤯 эпично лажанулись
🛠 создали интересные проекты

присылайте свои статьи на почту [email protected] с темой DevLife.

Требования простые:
🧑‍💻 Реальный опыт
🛤 Конкретные шаги
✍️ От 5000 знаков
📄 Ссылка на Google Docs

🔥 Лучшие истории опубликуем на сайте и в наших соцсетях с общим охватом 1 млн+ человек. Ждем ваши истории!
👍2😁1
🚀 Дональд Трамп анонсировал создание компании Stargate

💰 Инвестиции
- $500 миллиардов за 4 года на инфраструктуру ИИ для OpenAI в США.
- $100 миллиардов сразу.

🤝 Основные акционеры и партнеры
- Инвесторы: SoftBank, OpenAI, Oracle, MGX.
- Руководство: SoftBank (финансовая ответственность), OpenAI (операционная ответственность).

💻 Технологические партнеры
- Arm, Microsoft, NVIDIA, Oracle, OpenAI.

🔗 Сотрудничество
- OpenAI, Oracle и NVIDIA создадут вычислительную систему.
- Сотрудничество с Microsoft и Azure.

Источник
4🔥2😁1
🌟 15 табличных операций: Pandas ↔️ SQL ↔️ Polars ↔️ PySpark

Визуал, который показывает, как выполняются самые распространенные табличные операции в Pandas и их аналоги в SQL, Polars и PySpark.

#Pandas #SQL #Polars #PySpark
🔥11👍2
🎯 Понимание T-теста

T-тест — это статистический метод для проверки гипотез, анализа значимости признаков и сравнения моделей машинного обучения.

Типы T-тестов
1️⃣ Одновыборочный:
Сравнивает среднее значение одного набора данных с известным средним значением в популяции.
Пример использования: Проверка, отличается ли средняя метрика производительности модели от заданного базового значения (baseline).

2️⃣ Независимый (двухвыборочный):
Сравнивает средние значения двух независимых групп, чтобы определить, есть ли статистически значимые различия.
Пример использования: Сравнение результатов двух разных моделей или методов предобработки данных.

3️⃣ Парный:
Сравнивает средние значения двух зависимых групп.
Пример использования: Оценка влияния изменений в модели, например, после настройки гиперпараметров или добавления новых признаков.

Ограничения
⚠️ Чувствителен к выбросам, которые могут исказить результаты.
⚠️ Требует предположения о нормальности распределения данных (если выборки малы).
👍51🔥1🌚1
💡 Как получить от нейросети код, работающий в 100 раз быстрее

Интересный эксперимент провели с Claude 3.5 Sonnet: попытались улучшить простой алгоритм на Python, раз за разом прося ИИ «написать код лучше». Задача была несложная — найти разницу между максимальным и минимальным числами в массиве, сумма цифр которых равна 30.

Казалось бы, что тут можно улучшать?
👉 Подробнее в нашей статье

#CodeOptimization
3
2025/07/08 23:36:21
Back to Top
HTML Embed Code: