tgoop.com »
United States »
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение » Telegram Web
8 курсов от NVIDIA, которые стоит изучить
Generative AI Explained
🔹 Как работает генеративный ИИ
🔹 Применения и проблемы генеративного ИИ
AI for All: From Basics to GenAI Practice
🔹 Влияние ИИ на здравоохранение и автономные системы
🔹 Применение генеративного ИИ
Getting Started with AI
🔹 Сбор и разметка данных для моделей классификации
🔹 Обучение нейронной сети
Building A Brain in 10 Minutes
🔹 Как нейросети обучаются на данных
🔹 Математика нейронов в простых примерах
Building Video AI Applications
🔹 Создание видеопотоков с помощью DeepStream
🔹 Обработка нескольких потоков видео
Building RAG Agents with LLMs
🔹 Масштабируемое развертывание LLM
🔹 Использование LangChain для управления диалогами
Accelerate Data Science Workflows with Zero Code Changes
🔹 Ускорение обработки данных с помощью GPU
🔹 Преимущества унифицированных CPU и GPU потоков
Introduction to AI in the Data Center
🔹 Основы ИИ и архитектура GPU
🔹 Развертывание AI-инфраструктуры
🔹 AI-кластеры
Generative AI Explained
🔹 Как работает генеративный ИИ
🔹 Применения и проблемы генеративного ИИ
AI for All: From Basics to GenAI Practice
🔹 Влияние ИИ на здравоохранение и автономные системы
🔹 Применение генеративного ИИ
Getting Started with AI
🔹 Сбор и разметка данных для моделей классификации
🔹 Обучение нейронной сети
Building A Brain in 10 Minutes
🔹 Как нейросети обучаются на данных
🔹 Математика нейронов в простых примерах
Building Video AI Applications
🔹 Создание видеопотоков с помощью DeepStream
🔹 Обработка нескольких потоков видео
Building RAG Agents with LLMs
🔹 Масштабируемое развертывание LLM
🔹 Использование LangChain для управления диалогами
Accelerate Data Science Workflows with Zero Code Changes
🔹 Ускорение обработки данных с помощью GPU
🔹 Преимущества унифицированных CPU и GPU потоков
Introduction to AI in the Data Center
🔹 Основы ИИ и архитектура GPU
🔹 Развертывание AI-инфраструктуры
🔹 AI-кластеры
❤6👍1
✅ DeepSeek представляет новую открытую модель DeepSeek-R1
DeepSeek выпустили модель DeepSeek-R1, которая способна конкурировать с OpenAI-o1 в задачах математики, программирования и рассуждений. Модель распространяется под лицензией MIT, что позволяет свободно модифицировать, использовать и коммерциализировать.
😊 Меньшие версии модели превосходят GPT-4o и Claude-3.5-Sonnet в отдельных бенчмарках.
📊 Результаты API теперь можно использовать для fine-tuning и дистилляции.
💰 Доступны конкурентные цены на использование API.
Подробности
📈 DeepSeek-R1 достигает 97,3% на MATH-500 и 79,8% на AIME 2024.
🤖 Модель обучена с использованием многоступенчатого подхода: RLHF (обучение с подкреплением) и supervised дообучение.
🛠️ Доступны шесть версий модели — от 1,5B до 70B параметров для разных задач.
Ссылка
DeepSeek выпустили модель DeepSeek-R1, которая способна конкурировать с OpenAI-o1 в задачах математики, программирования и рассуждений. Модель распространяется под лицензией MIT, что позволяет свободно модифицировать, использовать и коммерциализировать.
😊 Меньшие версии модели превосходят GPT-4o и Claude-3.5-Sonnet в отдельных бенчмарках.
📊 Результаты API теперь можно использовать для fine-tuning и дистилляции.
💰 Доступны конкурентные цены на использование API.
Подробности
📈 DeepSeek-R1 достигает 97,3% на MATH-500 и 79,8% на AIME 2024.
🤖 Модель обучена с использованием многоступенчатого подхода: RLHF (обучение с подкреплением) и supervised дообучение.
🛠️ Доступны шесть версий модели — от 1,5B до 70B параметров для разных задач.
Ссылка
🔥4❤2👍2
✌️ Открытая редакция: ищем авторов для рубрики DevLife
Друзья, нас часто спрашивают про публикацию материалов о личном опыте и знаниях в IT. Пора это систематизировать!
Если у вас есть история о том, как вы:
📈 выросли в профессии
💡 освоили новые технологии
🚀 сделали крутой карьерный скачок
🤯 эпично лажанулись
🛠 создали интересные проекты
— присылайте свои статьи на почту [email protected] с темой DevLife.
Требования простые:
🧑💻 Реальный опыт
🛤 Конкретные шаги
✍️ От 5000 знаков
📄 Ссылка на Google Docs
🔥 Лучшие истории опубликуем на сайте и в наших соцсетях с общим охватом 1 млн+ человек. Ждем ваши истории!
Друзья, нас часто спрашивают про публикацию материалов о личном опыте и знаниях в IT. Пора это систематизировать!
Если у вас есть история о том, как вы:
📈 выросли в профессии
💡 освоили новые технологии
🚀 сделали крутой карьерный скачок
🤯 эпично лажанулись
🛠 создали интересные проекты
— присылайте свои статьи на почту [email protected] с темой DevLife.
Требования простые:
🧑💻 Реальный опыт
🛤 Конкретные шаги
✍️ От 5000 знаков
📄 Ссылка на Google Docs
🔥 Лучшие истории опубликуем на сайте и в наших соцсетях с общим охватом 1 млн+ человек. Ждем ваши истории!
👍2😁1
Forwarded from Библиотека задач по Data Science | тесты, код, задания
🚀 Дональд Трамп анонсировал создание компании Stargate
💰 Инвестиции
- $500 миллиардов за 4 года на инфраструктуру ИИ для OpenAI в США.
- $100 миллиардов сразу.
🤝 Основные акционеры и партнеры
- Инвесторы: SoftBank, OpenAI, Oracle, MGX.
- Руководство: SoftBank (финансовая ответственность), OpenAI (операционная ответственность).
💻 Технологические партнеры
- Arm, Microsoft, NVIDIA, Oracle, OpenAI.
🔗 Сотрудничество
- OpenAI, Oracle и NVIDIA создадут вычислительную систему.
- Сотрудничество с Microsoft и Azure.
Источник
💰 Инвестиции
- $500 миллиардов за 4 года на инфраструктуру ИИ для OpenAI в США.
- $100 миллиардов сразу.
🤝 Основные акционеры и партнеры
- Инвесторы: SoftBank, OpenAI, Oracle, MGX.
- Руководство: SoftBank (финансовая ответственность), OpenAI (операционная ответственность).
💻 Технологические партнеры
- Arm, Microsoft, NVIDIA, Oracle, OpenAI.
🔗 Сотрудничество
- OpenAI, Oracle и NVIDIA создадут вычислительную систему.
- Сотрудничество с Microsoft и Azure.
Источник
❤4🔥2😁1
🎯 Понимание T-теста
T-тест — это статистический метод для проверки гипотез, анализа значимости признаков и сравнения моделей машинного обучения.
Типы T-тестов
1️⃣ Одновыборочный:
Сравнивает среднее значение одного набора данных с известным средним значением в популяции.
Пример использования: Проверка, отличается ли средняя метрика производительности модели от заданного базового значения (baseline).
2️⃣ Независимый (двухвыборочный):
Сравнивает средние значения двух независимых групп, чтобы определить, есть ли статистически значимые различия.
Пример использования: Сравнение результатов двух разных моделей или методов предобработки данных.
3️⃣ Парный:
Сравнивает средние значения двух зависимых групп.
Пример использования: Оценка влияния изменений в модели, например, после настройки гиперпараметров или добавления новых признаков.
Ограничения
⚠️ Чувствителен к выбросам, которые могут исказить результаты.
⚠️ Требует предположения о нормальности распределения данных (если выборки малы).
T-тест — это статистический метод для проверки гипотез, анализа значимости признаков и сравнения моделей машинного обучения.
Типы T-тестов
1️⃣ Одновыборочный:
Сравнивает среднее значение одного набора данных с известным средним значением в популяции.
Пример использования: Проверка, отличается ли средняя метрика производительности модели от заданного базового значения (baseline).
2️⃣ Независимый (двухвыборочный):
Сравнивает средние значения двух независимых групп, чтобы определить, есть ли статистически значимые различия.
Пример использования: Сравнение результатов двух разных моделей или методов предобработки данных.
3️⃣ Парный:
Сравнивает средние значения двух зависимых групп.
Пример использования: Оценка влияния изменений в модели, например, после настройки гиперпараметров или добавления новых признаков.
Ограничения
⚠️ Чувствителен к выбросам, которые могут исказить результаты.
⚠️ Требует предположения о нормальности распределения данных (если выборки малы).
👍5❤1🔥1🌚1
Forwarded from Библиотека задач по Data Science | тесты, код, задания
😁3
💡 Как получить от нейросети код, работающий в 100 раз быстрее
Интересный эксперимент провели с Claude 3.5 Sonnet: попытались улучшить простой алгоритм на Python, раз за разом прося ИИ «написать код лучше». Задача была несложная — найти разницу между максимальным и минимальным числами в массиве, сумма цифр которых равна 30.
Казалось бы, что тут можно улучшать?
👉 Подробнее в нашей статье
#CodeOptimization
Интересный эксперимент провели с Claude 3.5 Sonnet: попытались улучшить простой алгоритм на Python, раз за разом прося ИИ «написать код лучше». Задача была несложная — найти разницу между максимальным и минимальным числами в массиве, сумма цифр которых равна 30.
Казалось бы, что тут можно улучшать?
👉 Подробнее в нашей статье
#CodeOptimization
❤3
Самые обсуждаемые работы в мире ИИ
🗞️ «Eliza: A Web3 friendly AI Agent Operating System»
Eliza — это операционная система агентов ИИ для Web3.
🗞️ «Enhancing Retrieval-Augmented Generation: A Study of Best Practices»
Изучение влияния различных компонентов RAG на качество ответов LLM.
🗞️ «LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs»
LlamaV-o1 представляет комплексную структуру для visual reasoning в LLM.
🗞️ «MangaNinja: Line Art Colorization with Precise Reference Following»
Модель, которая раскрашивает штриховые рисунки.
🗞️ «Multiagent Finetuning: Self Improvement with Diverse Reasoning Chains»
Новый подход к finetuning мультиагентных программ, улучшающий LLM.
🗞️ «OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking»
OmniThink — фреймворк, разработанный для повышения качества статей, создаваемых LLM.
🗞️ «VideoRAG: Retrieval-Augmented Generation over Video Corpus»
VideoRAG использует видео, чтобы сделать ответы ИИ более точными.
🗞️ «Eliza: A Web3 friendly AI Agent Operating System»
Eliza — это операционная система агентов ИИ для Web3.
🗞️ «Enhancing Retrieval-Augmented Generation: A Study of Best Practices»
Изучение влияния различных компонентов RAG на качество ответов LLM.
🗞️ «LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs»
LlamaV-o1 представляет комплексную структуру для visual reasoning в LLM.
🗞️ «MangaNinja: Line Art Colorization with Precise Reference Following»
Модель, которая раскрашивает штриховые рисунки.
🗞️ «Multiagent Finetuning: Self Improvement with Diverse Reasoning Chains»
Новый подход к finetuning мультиагентных программ, улучшающий LLM.
🗞️ «OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking»
OmniThink — фреймворк, разработанный для повышения качества статей, создаваемых LLM.
🗞️ «VideoRAG: Retrieval-Augmented Generation over Video Corpus»
VideoRAG использует видео, чтобы сделать ответы ИИ более точными.
👍2❤1