Telegram Web
🔥 Многие спрашивали обучалку для старта — и вот она:
“PyTorch за 1 час: от тензоров до Multi-GPU”


📖 Всего ~1 час чтения
💡 Идеально на выходные — без лишнего, только суть

Автор — Себастьян Рашка, почти 10 лет работает с PyTorch и обучает других. В этом гайде — всё, что нужно, чтобы стартовать и начать строить свои модели. Быстро, чётко, по делу.

https://sebastianraschka.com/teaching/pytorch-1h/
🔥52
🧠 Новый датасет от AllenAI: ACEcoder-R1 (filtered)

📦 Это отфильтрованная версия датасета ACEcoder, ориентированная на высококачественные задачи генерации кода.

Что внутри:

Более 63к пар *инструкция → код*
Вопросы, тест-кейсы и описания задач
Отфильтровано для максимальной чистоты формата (R1)
Подходит для обучения/тонкой настройки моделей типа CodeLlama, GPT-Code, DeepSeek-Coder и др.

🎯 Идеально для:

— Обучения генераторов код
— Fine-tuning агентов/ассистентов
— Benchmark-задач на reasoning + coding

🔗 Hugging Face: [https://huggingface.co/datasets/allenai/acecoder-r1-format-filtered
🧠 Обзор Vision-Language-Action-моделей

Авторы рассматривают, как мульти­модальные системы переходят от «вижу + понимаю» к «вижу + понимаю + _действую_». Ключевая идея — любой VLA-подход превращается в цепочку action tokens, которые всё ближе к исполнимым командам. Они выделяют 8 типов таких токенов:

1. Языковое описание
2. Машинный код / скрипты
3. Affordance-токены (что можно сделать с объектом)
4. Траектории движений
5. Целевое состояние сцены
6. Латентные представления
7. Сырые управляющие сигналы
8. Reasoning-токены для пошагового планирования

Почему важно

* Таксономия позволяет сравнивать существующие работы «на одном языке», а не по разрозненным метрикам.
* Показано, какие токены лучше подходят для генерации длинных планов, а какие — для точного позиционирования робота.
* Авторы указывают белые пятна: нет единых бенчмарков, слабо изучена переформатируемость токенов, мало работ по переносу сим➜реал.

Action token — это компромисс между интерпретацией человеком и контролем робота. Разработчикам стоит подбирать тип токена под задачу, а не «брать первый попавшийся». Внедрение предложенной классификации упростит сравнение новых моделей и ускорит путь к универсальным агентам. 🔥

https://huggingface.co/papers/2507.01925
🤯2
🚀Kafka must-have инструмент для современных проектов MLOps!

Присоединяйся к вебинару и узнай, как настроить Kafka для обработки потоковых данных и интегрировать её в MLOps-проекты. Вебинар проходит в рамках подписки на курсы OTUS, которая даёт возможность приобрести 3 курса по цене одного.

🔑 Что будет:
— Практическое и теоретическое руководство по настройке Kafka в Docker и взаимодействию с ней через Python.
— Обзор инструментов для работы с Kafka: поднятие UI-интерфейса и управление потоками данных.
— Примеры использования Kafka для связи микросервисов и обзор ключевых функций, делающих её незаменимой брокером сообщений.
— Как использовать Kafka в MLOps: сбор данных для ML-моделей, мониторинг их работы и интеграция предсказаний в реальном времени.

🚀Регистрация по ссылке - https://otus.pw/18rU/
Подробнее о подписке OTUS - https://otus.pw/SMQu/

👉 Запишись сейчас, количество мест ограничено!
1🍓1
📊 D2 — современный язык для описания диаграмм с помощью текста!

💡 Этот инструмент преобразует текстовые сценарии в визуальные диаграммы, используя декларативный подход: вы описываете, что хотите видеть, а D2 автоматически создает визуализацию.

🔍 Особенности D2:

🌟 Простая синтаксическая структура и встроенные темы для быстрой визуализации.

🌟 Поддержка анимаций, LaTeX, нескольких языков, Markdown, UML и последовательностных диаграмм.

🌟 Экспорт в форматы PNG, SVG и PDF.

🌟 Возможность использования в локальном CLI или в онлайн-песочнице для быстрого создания и редактирования диаграмм.

🌟 Поддержка различных движков для компоновки, работы с контейнерами и импорта изображений.

🔐 Лицензия: MPL-2.0

🖥 Github
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Groq открывает первый европейский дата-центр.

Первый дата-центр Groq в ЕС разместится в Хельсинки, Финляндия, в сотрудничестве с местным провайдером Equinix. Этот шаг направлен на удовлетворение растущего спроса со стороны европейских клиентов, которым необходимы минимальная задержка и высокая скорость обработки запросов. Размещение инфраструктуры в Финляндии также решает вопросы суверенитета данных европейских пользователей.

Европейский хаб станет частью глобальной сети компании, которая уже включает мощности в США, Канаде и Саудовской Аравии. Выбор Финляндии обусловлен ее надежной энергосистемой и возможностями для эффективного охлаждения оборудования.
groq.com

✔️ БРИКС предложил принципы глобального регулирования ИИ.

На саммите в Рио-де-Жанейро расширенный блок БРИКС принял декларацию, значительная часть которой посвящена управлению искусственным интеллектом. В документе содержится инициатива к созданию глобальной системы регулирования под эгидой ООН, чтобы преимущества технологии были доступны всем странам, включая Глобальный Юг.

Ключевые принципы, предложенные блоком: защита от несанкционированного использования ИИ, ограничение на избыточный сбор данных и разработка механизмов справедливой компенсации для правообладателей. Декларация также подтверждает суверенное право каждой страны устанавливать собственные правила, но рекомендует создание совместимых международных стандартов.
reuters.com

✔️ NVIDIA построит в Израиле технологический кампус.

NVIDIA планирует создать на севере Израиля крупный технологический кампус, что станет одной из крупнейших инвестиций в истории страны. Для проработки деталей проекта уже выпущен официальный запрос информации (RFI).

Цель «мегакампуса» - значительно расширить операции NVIDIA и ускорить инновации в области ИИ. На данный момент в израильском центре исследований и разработок NVIDIA, который является крупнейшим за пределами США, уже работает около 5000 сотрудников.
timesofisrael.com

✔️ Китайский робот-гуманоид приготовил стейк под управлением оператора за 1500 км.

Shenzhen Dobot продемонстрировала возможности телеуправления своим роботом Dobot Atom. Находясь в провинции Шаньдун, робот успешно приготовил стейк, в то время как оператор управлял им из провинции Гуандун, с расстояния 1500 километров.

Управление осуществлялось в реальном времени с помощью VR-гарнитуры, которая отслеживала и передавала движения рук инженера. В ходе демонстрации робот выполнил несколько сложных задач с точностью движений до 0.05 мм.

Dobot уже начала глобальные поставки Atom, став одним из немногих китайских разработчиков гуманоидов, вышедших на стадию серийного производства.
scmp.com

✔️ ByteDance выложила в открытый доступ агента-программиста Trae.

Trae Agent превращает текстовые запросы в рабочий код. Этот экспериментальный проект использует Claude и Gemini, чтобы писать, отлаживать и исправлять ошибки в коде без участия человека. Он работает через командную строку, анализирует большие проекты, применяет bash-скрипты и обновляет файлы в реальном времени.

Система уже показала высокие результаты на тесте SWE-bench Verified. Trae открыт под MIT-лицензией, а его команда планирует расширить поддержку LLM, добавить MCP и усилить Unit-тестирование.
github.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🔥2
🎥 Memvid — революционный способ хранения и поиска текстовых данных в видеоформате

Этот проект превращает миллионы текстовых фрагментов в сжатое MP4-видео с сохранением возможности семантического поиска. Технология кодирует текст в QR-коды, используя преимущества современных видеокодеков для сверхэффективного сжатия — до 100 раз компактнее векторных баз данных.

Поиск работает напрямую по видеофайлу без серверной инфраструктуры, с задержкой менее 100 мс. Поддерживается интеграция с PDF и Markdown, а в будущем разработчики обещают облачный интерфейс и потоковое добавление данных.

🤖 GitHub

@bigdatai
🔥7
2025/07/10 08:27:37
Back to Top
HTML Embed Code: