tgoop.com »
United States »
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение » Telegram Web
Как провести выходные с пользой? Вместо сериалов попробуйте сайт Datalemur
Здесь собраны задачи по SQL, статистике, машинному обучению и Python, которые часто встречаются на интервью в крупных IT-компаниях.
🐒 Задачи по SQL, чтобы найти, сколько бананов съели лемуры.
🤖 Кейсы по машинному обучению для прогнозирования количества чашек кофе до дедлайна.
📊 Уравнения по статистике, чтобы понять, хватит ли одной пиццы на всю команду.
Платформа помогает прокачать навыки и подготовиться к интервью.
☕ Чтобы начать, заварите чай, зайдите на сайт, выберите категорию задач и погружайтесь в мир аналитики. Это отличный способ провести время с пользой, даже если не планируете менять работу.
#АналитикаДанных #FAANG #Интервью #Задачи
Здесь собраны задачи по SQL, статистике, машинному обучению и Python, которые часто встречаются на интервью в крупных IT-компаниях.
🐒 Задачи по SQL, чтобы найти, сколько бананов съели лемуры.
🤖 Кейсы по машинному обучению для прогнозирования количества чашек кофе до дедлайна.
📊 Уравнения по статистике, чтобы понять, хватит ли одной пиццы на всю команду.
Платформа помогает прокачать навыки и подготовиться к интервью.
☕ Чтобы начать, заварите чай, зайдите на сайт, выберите категорию задач и погружайтесь в мир аналитики. Это отличный способ провести время с пользой, даже если не планируете менять работу.
#АналитикаДанных #FAANG #Интервью #Задачи
❤6👍4
🧹 Cleanlab — инструмент, который поможет очистить данные
📊 Этот пакет отлично работает с реальными «грязными» данными. Cleanlab использует существующие модели, чтобы находить и исправлять ошибки в данных, позволяя обучать ещё более точные и надёжные модели.
Проект
#ЧисткаДанных
📊 Этот пакет отлично работает с реальными «грязными» данными. Cleanlab использует существующие модели, чтобы находить и исправлять ошибки в данных, позволяя обучать ещё более точные и надёжные модели.
Проект
#ЧисткаДанных
👍5❤1🤩1
Forwarded from Proglib.academy | IT-курсы
Рассказываем об основных терминах, методах и инструментах, которые используются при анализе больших данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🎨 Создавайте датасеты за секунды прямо в Jupyter
Представляем библиотеку Python — drawdata, которая позволяет визуализировать и создавать датасеты буквально за три строки кода.
📊 Это невероятно полезный инструмент для разработчиков, работающих с данными.
Пример:
✨ Библиотеку создал и поддерживает Vincent D. Warmerdam, автор множества других полезных инструментов.
🌟 Ознакомьтесь с репозиторием и поставьте звезду: github
#Python #DataScience #Jupyter #ВизуализацияДанных #Разработка
Представляем библиотеку Python — drawdata, которая позволяет визуализировать и создавать датасеты буквально за три строки кода.
📊 Это невероятно полезный инструмент для разработчиков, работающих с данными.
Пример:
python from drawdata import ScatterWidget widget = ScatterWidget() widget
✨ Библиотеку создал и поддерживает Vincent D. Warmerdam, автор множества других полезных инструментов.
🌟 Ознакомьтесь с репозиторием и поставьте звезду: github
#Python #DataScience #Jupyter #ВизуализацияДанных #Разработка
🔥12👍4❤1
🌍 50 ведущих экспертов ИИ 2025 года
⚡ От ИИ и машинного обучения до устойчивого развития — эти эксперты делают цифровую трансформацию доступной для всех. В этом списке нет крупных корпораций, только настоящие лидеры мнений и создатели контента.
Список
👀 А вы уже следите за кем-то из этого списка? Поделитесь!
#ИскусственныйИнтеллект #БудущееТехнологий
⚡ От ИИ и машинного обучения до устойчивого развития — эти эксперты делают цифровую трансформацию доступной для всех. В этом списке нет крупных корпораций, только настоящие лидеры мнений и создатели контента.
Список
👀 А вы уже следите за кем-то из этого списка? Поделитесь!
#ИскусственныйИнтеллект #БудущееТехнологий
👍2🔥1
8 курсов от NVIDIA, которые стоит изучить
Generative AI Explained
🔹 Как работает генеративный ИИ
🔹 Применения и проблемы генеративного ИИ
AI for All: From Basics to GenAI Practice
🔹 Влияние ИИ на здравоохранение и автономные системы
🔹 Применение генеративного ИИ
Getting Started with AI
🔹 Сбор и разметка данных для моделей классификации
🔹 Обучение нейронной сети
Building A Brain in 10 Minutes
🔹 Как нейросети обучаются на данных
🔹 Математика нейронов в простых примерах
Building Video AI Applications
🔹 Создание видеопотоков с помощью DeepStream
🔹 Обработка нескольких потоков видео
Building RAG Agents with LLMs
🔹 Масштабируемое развертывание LLM
🔹 Использование LangChain для управления диалогами
Accelerate Data Science Workflows with Zero Code Changes
🔹 Ускорение обработки данных с помощью GPU
🔹 Преимущества унифицированных CPU и GPU потоков
Introduction to AI in the Data Center
🔹 Основы ИИ и архитектура GPU
🔹 Развертывание AI-инфраструктуры
🔹 AI-кластеры
Generative AI Explained
🔹 Как работает генеративный ИИ
🔹 Применения и проблемы генеративного ИИ
AI for All: From Basics to GenAI Practice
🔹 Влияние ИИ на здравоохранение и автономные системы
🔹 Применение генеративного ИИ
Getting Started with AI
🔹 Сбор и разметка данных для моделей классификации
🔹 Обучение нейронной сети
Building A Brain in 10 Minutes
🔹 Как нейросети обучаются на данных
🔹 Математика нейронов в простых примерах
Building Video AI Applications
🔹 Создание видеопотоков с помощью DeepStream
🔹 Обработка нескольких потоков видео
Building RAG Agents with LLMs
🔹 Масштабируемое развертывание LLM
🔹 Использование LangChain для управления диалогами
Accelerate Data Science Workflows with Zero Code Changes
🔹 Ускорение обработки данных с помощью GPU
🔹 Преимущества унифицированных CPU и GPU потоков
Introduction to AI in the Data Center
🔹 Основы ИИ и архитектура GPU
🔹 Развертывание AI-инфраструктуры
🔹 AI-кластеры
❤6👍1
✅ DeepSeek представляет новую открытую модель DeepSeek-R1
DeepSeek выпустили модель DeepSeek-R1, которая способна конкурировать с OpenAI-o1 в задачах математики, программирования и рассуждений. Модель распространяется под лицензией MIT, что позволяет свободно модифицировать, использовать и коммерциализировать.
😊 Меньшие версии модели превосходят GPT-4o и Claude-3.5-Sonnet в отдельных бенчмарках.
📊 Результаты API теперь можно использовать для fine-tuning и дистилляции.
💰 Доступны конкурентные цены на использование API.
Подробности
📈 DeepSeek-R1 достигает 97,3% на MATH-500 и 79,8% на AIME 2024.
🤖 Модель обучена с использованием многоступенчатого подхода: RLHF (обучение с подкреплением) и supervised дообучение.
🛠️ Доступны шесть версий модели — от 1,5B до 70B параметров для разных задач.
Ссылка
DeepSeek выпустили модель DeepSeek-R1, которая способна конкурировать с OpenAI-o1 в задачах математики, программирования и рассуждений. Модель распространяется под лицензией MIT, что позволяет свободно модифицировать, использовать и коммерциализировать.
😊 Меньшие версии модели превосходят GPT-4o и Claude-3.5-Sonnet в отдельных бенчмарках.
📊 Результаты API теперь можно использовать для fine-tuning и дистилляции.
💰 Доступны конкурентные цены на использование API.
Подробности
📈 DeepSeek-R1 достигает 97,3% на MATH-500 и 79,8% на AIME 2024.
🤖 Модель обучена с использованием многоступенчатого подхода: RLHF (обучение с подкреплением) и supervised дообучение.
🛠️ Доступны шесть версий модели — от 1,5B до 70B параметров для разных задач.
Ссылка
🔥4❤2👍2
✌️ Открытая редакция: ищем авторов для рубрики DevLife
Друзья, нас часто спрашивают про публикацию материалов о личном опыте и знаниях в IT. Пора это систематизировать!
Если у вас есть история о том, как вы:
📈 выросли в профессии
💡 освоили новые технологии
🚀 сделали крутой карьерный скачок
🤯 эпично лажанулись
🛠 создали интересные проекты
— присылайте свои статьи на почту [email protected] с темой DevLife.
Требования простые:
🧑💻 Реальный опыт
🛤 Конкретные шаги
✍️ От 5000 знаков
📄 Ссылка на Google Docs
🔥 Лучшие истории опубликуем на сайте и в наших соцсетях с общим охватом 1 млн+ человек. Ждем ваши истории!
Друзья, нас часто спрашивают про публикацию материалов о личном опыте и знаниях в IT. Пора это систематизировать!
Если у вас есть история о том, как вы:
📈 выросли в профессии
💡 освоили новые технологии
🚀 сделали крутой карьерный скачок
🤯 эпично лажанулись
🛠 создали интересные проекты
— присылайте свои статьи на почту [email protected] с темой DevLife.
Требования простые:
🧑💻 Реальный опыт
🛤 Конкретные шаги
✍️ От 5000 знаков
📄 Ссылка на Google Docs
🔥 Лучшие истории опубликуем на сайте и в наших соцсетях с общим охватом 1 млн+ человек. Ждем ваши истории!
👍2😁1
Forwarded from Библиотека задач по Data Science | тесты, код, задания
🚀 Дональд Трамп анонсировал создание компании Stargate
💰 Инвестиции
- $500 миллиардов за 4 года на инфраструктуру ИИ для OpenAI в США.
- $100 миллиардов сразу.
🤝 Основные акционеры и партнеры
- Инвесторы: SoftBank, OpenAI, Oracle, MGX.
- Руководство: SoftBank (финансовая ответственность), OpenAI (операционная ответственность).
💻 Технологические партнеры
- Arm, Microsoft, NVIDIA, Oracle, OpenAI.
🔗 Сотрудничество
- OpenAI, Oracle и NVIDIA создадут вычислительную систему.
- Сотрудничество с Microsoft и Azure.
Источник
💰 Инвестиции
- $500 миллиардов за 4 года на инфраструктуру ИИ для OpenAI в США.
- $100 миллиардов сразу.
🤝 Основные акционеры и партнеры
- Инвесторы: SoftBank, OpenAI, Oracle, MGX.
- Руководство: SoftBank (финансовая ответственность), OpenAI (операционная ответственность).
💻 Технологические партнеры
- Arm, Microsoft, NVIDIA, Oracle, OpenAI.
🔗 Сотрудничество
- OpenAI, Oracle и NVIDIA создадут вычислительную систему.
- Сотрудничество с Microsoft и Azure.
Источник
❤4🔥2😁1
🎯 Понимание T-теста
T-тест — это статистический метод для проверки гипотез, анализа значимости признаков и сравнения моделей машинного обучения.
Типы T-тестов
1️⃣ Одновыборочный:
Сравнивает среднее значение одного набора данных с известным средним значением в популяции.
Пример использования: Проверка, отличается ли средняя метрика производительности модели от заданного базового значения (baseline).
2️⃣ Независимый (двухвыборочный):
Сравнивает средние значения двух независимых групп, чтобы определить, есть ли статистически значимые различия.
Пример использования: Сравнение результатов двух разных моделей или методов предобработки данных.
3️⃣ Парный:
Сравнивает средние значения двух зависимых групп.
Пример использования: Оценка влияния изменений в модели, например, после настройки гиперпараметров или добавления новых признаков.
Ограничения
⚠️ Чувствителен к выбросам, которые могут исказить результаты.
⚠️ Требует предположения о нормальности распределения данных (если выборки малы).
T-тест — это статистический метод для проверки гипотез, анализа значимости признаков и сравнения моделей машинного обучения.
Типы T-тестов
1️⃣ Одновыборочный:
Сравнивает среднее значение одного набора данных с известным средним значением в популяции.
Пример использования: Проверка, отличается ли средняя метрика производительности модели от заданного базового значения (baseline).
2️⃣ Независимый (двухвыборочный):
Сравнивает средние значения двух независимых групп, чтобы определить, есть ли статистически значимые различия.
Пример использования: Сравнение результатов двух разных моделей или методов предобработки данных.
3️⃣ Парный:
Сравнивает средние значения двух зависимых групп.
Пример использования: Оценка влияния изменений в модели, например, после настройки гиперпараметров или добавления новых признаков.
Ограничения
⚠️ Чувствителен к выбросам, которые могут исказить результаты.
⚠️ Требует предположения о нормальности распределения данных (если выборки малы).
👍5❤1🔥1🌚1
Forwarded from Библиотека задач по Data Science | тесты, код, задания
😁3
💡 Как получить от нейросети код, работающий в 100 раз быстрее
Интересный эксперимент провели с Claude 3.5 Sonnet: попытались улучшить простой алгоритм на Python, раз за разом прося ИИ «написать код лучше». Задача была несложная — найти разницу между максимальным и минимальным числами в массиве, сумма цифр которых равна 30.
Казалось бы, что тут можно улучшать?
👉 Подробнее в нашей статье
#CodeOptimization
Интересный эксперимент провели с Claude 3.5 Sonnet: попытались улучшить простой алгоритм на Python, раз за разом прося ИИ «написать код лучше». Задача была несложная — найти разницу между максимальным и минимальным числами в массиве, сумма цифр которых равна 30.
Казалось бы, что тут можно улучшать?
👉 Подробнее в нашей статье
#CodeOptimization
❤3