⚡ Новое исследование: меньше — значит лучше?
Авторы работы проверили, правда ли **Sparse Mixture of Experts (MoE)**-модели становятся лучше просто за счёт роста размера.
🔎 Сравнивали 8 открытых моделей на 10 бенчмарках в одинаковых условиях, проверяя результаты статистическими тестами.
Ключевые выводы
- 🏆 GPT-OSS 20B обошёл GPT-OSS 120B на MMLU и HumanEval.
- ⚡ 20B требует в 5 раз меньше GPU-памяти и на 2.6 раза меньше энергии на ответ.
- 20B даёт более короткие и точные ответы, а 120B часто проигрывает из-за неэффективного роутинга или обучения.
- Обе модели сильны в генерации кода, но слабы на китайских задачах.
Практическое значение
- ✅ Для английского кода и структурных рассуждений выгоднее использовать 20B — выше пропускная способность и ниже задержка.
- ❌ Для многоязычных и профессиональных доменов преимущества не так очевидны.
📄 Paper: arxiv.org/abs/2508.12461
Авторы работы проверили, правда ли **Sparse Mixture of Experts (MoE)**-модели становятся лучше просто за счёт роста размера.
🔎 Сравнивали 8 открытых моделей на 10 бенчмарках в одинаковых условиях, проверяя результаты статистическими тестами.
Ключевые выводы
- 🏆 GPT-OSS 20B обошёл GPT-OSS 120B на MMLU и HumanEval.
- ⚡ 20B требует в 5 раз меньше GPU-памяти и на 2.6 раза меньше энергии на ответ.
- 20B даёт более короткие и точные ответы, а 120B часто проигрывает из-за неэффективного роутинга или обучения.
- Обе модели сильны в генерации кода, но слабы на китайских задачах.
Практическое значение
- ✅ Для английского кода и структурных рассуждений выгоднее использовать 20B — выше пропускная способность и ниже задержка.
- ❌ Для многоязычных и профессиональных доменов преимущества не так очевидны.
📄 Paper: arxiv.org/abs/2508.12461
👍6❤4🔥2🥰1
⚡️Qoder — бесплатный ИИ-редактор кода от Alibaba
Разработчики называют его платформой для кодинга «нового поколения». Qoder понимает всю кодовую базу, разбивает задачу на шаги, запоминает твой стиль и самое классное — модель подбирается автоматически в зависимости от задачи.
Есть еще Quest Mode: описываешь задачу, а Qoder сам пишет спецификацию, планирует и выполняет изменения по коду.
https://qoder.com/
Разработчики называют его платформой для кодинга «нового поколения». Qoder понимает всю кодовую базу, разбивает задачу на шаги, запоминает твой стиль и самое классное — модель подбирается автоматически в зависимости от задачи.
Есть еще Quest Mode: описываешь задачу, а Qoder сам пишет спецификацию, планирует и выполняет изменения по коду.
https://qoder.com/
👍6❤5🔥3🤬2😁1
Forwarded from Machinelearning
По слухам, которые появились из-за поста инженера DeepMind Патрика Лоебера в сети Х, на этой неделе мы увидим инпейнт-модель для редактирования изображений под названием Nano Banana.
Модель наделала шуму на Lmarena, да и тестеры предварительных версий отмечают способность вносить очень точечные изменения в изображение, не затрагивая другие его элементы.
При этом качество изображений, генерируемое Nano Banana сопоставимо с результатами более крупных и ресурсоемких систем.
Официально Google пока не объявляла дату запуска и не раскрывала информацию о ценах.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
📉 MIT: 95% AI-пилотов проваливаются
MIT опубликовали отчёт, который напугал инвесторов:
🔴 95% проектов по внедрению GenAI не дают никакой отдачи.
✅ Лишь 5% компаний получают результат — потому что делают иначе:
- интегрируют ИИ прямо в рабочие процессы,
- дают системам возможность учиться и адаптироваться,
- улучшают их на основе реального использования.
❌ А большинство компаний повторяет ошибку — покупают “статичные” решения, которые эффектно смотрятся на демо, но в реальности:
- не помнят контекст,
- не подстраиваются под задачи,
- не помогают в ежедневной работе.
🧪 Как MIT изучали проблему
- проанализировали 300+ кейсов внедрения,
- провели 52 интервью,
- собрали 153 опроса у топ-менеджеров (январь–июнь 2025).
Вывод: успех дают не красивые пилоты, а живые системы, встроенные в бизнес.
🟢 Подробнее
MIT опубликовали отчёт, который напугал инвесторов:
🔴 95% проектов по внедрению GenAI не дают никакой отдачи.
✅ Лишь 5% компаний получают результат — потому что делают иначе:
- интегрируют ИИ прямо в рабочие процессы,
- дают системам возможность учиться и адаптироваться,
- улучшают их на основе реального использования.
❌ А большинство компаний повторяет ошибку — покупают “статичные” решения, которые эффектно смотрятся на демо, но в реальности:
- не помнят контекст,
- не подстраиваются под задачи,
- не помогают в ежедневной работе.
🧪 Как MIT изучали проблему
- проанализировали 300+ кейсов внедрения,
- провели 52 интервью,
- собрали 153 опроса у топ-менеджеров (январь–июнь 2025).
Вывод: успех дают не красивые пилоты, а живые системы, встроенные в бизнес.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍3🔥3
Media is too big
VIEW IN TELEGRAM
🆕 GeoSAM2 — новый уровень интерактивной 3D-сегментации
Теперь можно выделять части 3D-моделей простыми 2D-кликами или рамками на изображении, а система автоматически проецирует выделение на весь объект.
✨ Особенности:
- Интерактивность: клики вместо сложных текстов.
- Точность: выделение как крупных, так и мелких деталей.
- Эффективность: без переобучения на каждом объекте.
- Лидерство на бенчмарках PartObjaverse-Tiny и PartNetE.
🚀 Подходит для дизайнеров, геймдева и робототехники, где важна точная работа с деталями 3D-объектов.
🔗 Демка: https://detailgen3d.github.io/GeoSAM2/
Теперь можно выделять части 3D-моделей простыми 2D-кликами или рамками на изображении, а система автоматически проецирует выделение на весь объект.
✨ Особенности:
- Интерактивность: клики вместо сложных текстов.
- Точность: выделение как крупных, так и мелких деталей.
- Эффективность: без переобучения на каждом объекте.
- Лидерство на бенчмарках PartObjaverse-Tiny и PartNetE.
🚀 Подходит для дизайнеров, геймдева и робототехники, где важна точная работа с деталями 3D-объектов.
🔗 Демка: https://detailgen3d.github.io/GeoSAM2/
👍5🔥3❤2
🔹 Современные LLM способны решать широкий круг задач — от генерации кода до подготовки аналитических отчётов.
Но на практике многие сталкиваются с тем, что ответы модели слишком общие, неточные или требуют значительной доработки.
Причина в том, что результат напрямую зависит от формулировки запроса.
Грамотный промт превращает LLM из «демонстрации технологий» в рабочий инструмент, который экономит время и снижает количество ошибок.
📘 На Stepik доступен курс
«Prompt Engineering: искусство работы с ИИ»
Что вы освоите:
* методы составления чётких и воспроизводимых запросов;
* управление форматом вывода (код, JSON, таблицы, структурированные тексты);
* построение последовательных цепочек промтов для комплексных задач;
* практические подходы к проверке и улучшению качества ответов модели;
* примеры применения в IT, аналитике, управлении и образовании.
🎯 Формат курса: концентрированные уроки с обязательной практикой.
🎓 По итогам — сертификат Stepik и собственный набор рабочих промтов, готовых к применению в реальной работе.
⚡ В течение 48 часов действует скидка 25%
👉 Пройти курс на Stepik
Но на практике многие сталкиваются с тем, что ответы модели слишком общие, неточные или требуют значительной доработки.
Причина в том, что результат напрямую зависит от формулировки запроса.
Грамотный промт превращает LLM из «демонстрации технологий» в рабочий инструмент, который экономит время и снижает количество ошибок.
📘 На Stepik доступен курс
«Prompt Engineering: искусство работы с ИИ»
Что вы освоите:
* методы составления чётких и воспроизводимых запросов;
* управление форматом вывода (код, JSON, таблицы, структурированные тексты);
* построение последовательных цепочек промтов для комплексных задач;
* практические подходы к проверке и улучшению качества ответов модели;
* примеры применения в IT, аналитике, управлении и образовании.
🎯 Формат курса: концентрированные уроки с обязательной практикой.
🎓 По итогам — сертификат Stepik и собственный набор рабочих промтов, готовых к применению в реальной работе.
⚡ В течение 48 часов действует скидка 25%
👉 Пройти курс на Stepik
❤5🔥4👍3👎1😁1
🎉 Open-Fiesta: AI Chat Playground
Open-Fiesta — это открытая платформа для общения с ИИ, построенная на Next.js. Она позволяет переключаться между различными моделями и провайдерами, сравнивать их результаты и использовать веб-поиск и вложения изображений.
🚀 Основные моменты:
- Поддержка нескольких провайдеров (Gemini, OpenRouter и др.)
- Выбор до 5 моделей для одновременного использования
- Встроенный веб-поиск для каждого сообщения
- Поддержка вложений изображений
- Удобный интерфейс с нормализацией API
🟣 Ссылка: https://github.com/NiladriHazra/Open-Fiesta
testauopost
Open-Fiesta — это открытая платформа для общения с ИИ, построенная на Next.js. Она позволяет переключаться между различными моделями и провайдерами, сравнивать их результаты и использовать веб-поиск и вложения изображений.
🚀 Основные моменты:
- Поддержка нескольких провайдеров (Gemini, OpenRouter и др.)
- Выбор до 5 моделей для одновременного использования
- Встроенный веб-поиск для каждого сообщения
- Поддержка вложений изображений
- Удобный интерфейс с нормализацией API
🟣 Ссылка: https://github.com/NiladriHazra/Open-Fiesta
testauopost
🔥5❤3🥰2🤔1
🔥 Нашёл классный ресурс по истории ИИ
Оказывается, статьи в духе *«AI замедляется»* выходят уже много лет подряд.
Теперь появился сайт, где собрали все эти «думерские» публикации в одном месте.
Интересно пролистать и посмотреть, как регулярно предсказывали «конец прогресса» в ИИ.
aislowdown.replit.app
Оказывается, статьи в духе *«AI замедляется»* выходят уже много лет подряд.
Теперь появился сайт, где собрали все эти «думерские» публикации в одном месте.
Интересно пролистать и посмотреть, как регулярно предсказывали «конец прогресса» в ИИ.
aislowdown.replit.app
❤3🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
10–11 сентября встречаемся на IT Elements — конференции, сделанной айтишниками для айтишников.
Площадка в третий раз станет точкой притяжения тех, кто реально делает ИТ в России. В этом году в фокусе — всё самое важное: инфраструктура, сети, кибербезопасность, и впервые — отдельный трек по Data & AI!
Крупнейшие игроки рынка будут обсуждать, где заканчивается хайп и начинается реальная польза от ИИ.
▪️Корпоративный ИИ: как внедрять GPT-модели, AI-ассистентов и цифровых двойников в крупный бизнес.
▪️AI в маркетинге: как нейросети анализируют данные клиентов и предсказывают спрос.
▪️DataOps & MLOps: как устроены цифровые фабрики данных и как DevOps, MLOps и DataOps работают вместе.
▪️Big Data → Big Value: как из данных в промышленности извлекать реальную ценность.
Формат: офлайн (Москва) или онлайн.
Участие бесплатное, по предварительной регистрации.
Площадка в третий раз станет точкой притяжения тех, кто реально делает ИТ в России. В этом году в фокусе — всё самое важное: инфраструктура, сети, кибербезопасность, и впервые — отдельный трек по Data & AI!
Крупнейшие игроки рынка будут обсуждать, где заканчивается хайп и начинается реальная польза от ИИ.
▪️Корпоративный ИИ: как внедрять GPT-модели, AI-ассистентов и цифровых двойников в крупный бизнес.
▪️AI в маркетинге: как нейросети анализируют данные клиентов и предсказывают спрос.
▪️DataOps & MLOps: как устроены цифровые фабрики данных и как DevOps, MLOps и DataOps работают вместе.
▪️Big Data → Big Value: как из данных в промышленности извлекать реальную ценность.
Формат: офлайн (Москва) или онлайн.
Участие бесплатное, по предварительной регистрации.
Forwarded from Анализ данных (Data analysis)
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Tencent выпустила HunyuanVideo-Foley — открытую систему, которая умеет автоматически превращать видео и текст в качественный звук (Text-Video-to-Audio, TV2A).
🔊 Модель может автоматически генерировать профессиональный звук, который точно совпадает с картинкой и смыслом происходящего.
✨ Главное:
- Универсальность — обучена на 100 000+ часов данных, создаёт звук для любых сцен: от природы до мультфильмов.
- Согласованность текста и видео — новая архитектура *MMDiT* учитывает одновременно изображение и описание, создавая многослойные эффекты: и главный звук, и фоновое окружение.
- Качество студийного уровня — благодаря функции потерь *REPA* и *Audio VAE* звук получается чистым и стабильным, без шумов и артефактов.
📈 На тестах HunyuanVideo-Foley показала лучшие результаты среди открытых моделей: более качественный звук, точная синхронизация с картинкой и учёт контекста сцены.
👉 Попробовать: https://hunyuan.tencent.com/video/zh?tabIndex=0
🌐 Project Page: https://szczesnys.github.io/hunyuanvideo-foley/
🔗 Code: https://github.com/Tencent-Hunyuan/HunyuanVideo-Foley
📄 Report: https://arxiv.org/abs/2508.16930
🤗 Hugging Face: https://huggingface.co/tencent/HunyuanVideo-Foley
@data_analysis_ml
🔊 Модель может автоматически генерировать профессиональный звук, который точно совпадает с картинкой и смыслом происходящего.
✨ Главное:
- Универсальность — обучена на 100 000+ часов данных, создаёт звук для любых сцен: от природы до мультфильмов.
- Согласованность текста и видео — новая архитектура *MMDiT* учитывает одновременно изображение и описание, создавая многослойные эффекты: и главный звук, и фоновое окружение.
- Качество студийного уровня — благодаря функции потерь *REPA* и *Audio VAE* звук получается чистым и стабильным, без шумов и артефактов.
📈 На тестах HunyuanVideo-Foley показала лучшие результаты среди открытых моделей: более качественный звук, точная синхронизация с картинкой и учёт контекста сцены.
👉 Попробовать: https://hunyuan.tencent.com/video/zh?tabIndex=0
🌐 Project Page: https://szczesnys.github.io/hunyuanvideo-foley/
🔗 Code: https://github.com/Tencent-Hunyuan/HunyuanVideo-Foley
📄 Report: https://arxiv.org/abs/2508.16930
🤗 Hugging Face: https://huggingface.co/tencent/HunyuanVideo-Foley
@data_analysis_ml
❤3🔥3
⚡️ YandexGPT 5.1 Pro — новая флагманская модель Яндекса для бизнеса
Yandex B2B Tech представила обновлённую генеративную модель, доступную в Yandex Cloud AI Studio.
🔹 Основные возможности:
— краткие и структурированные ответы для корпоративных сценариев;
— улучшенная работа с документами и базами знаний (RAG);
— поддержка системного промта для жёсткой настройки роли, стиля и ограничений диалога;
— модель стала прозрачнее: корректно сообщает об отсутствии знаний;
— улучшено понимание российских фактов и культурного контекста.
📈 Метрики качества:
— в 58% случаев ответы лучше прошлой версии;
— 56% преимуществ над GPT-4.1 (OpenAI);
— доля «хороших» ответов выросла с 60% до 71%;
— количество выдумок снизилось почти в 2 раза — до 16%.
💰 Стоимость снижена втрое: 40 коп. за 1000 токенов.
Yandex B2B Tech представила обновлённую генеративную модель, доступную в Yandex Cloud AI Studio.
🔹 Основные возможности:
— краткие и структурированные ответы для корпоративных сценариев;
— улучшенная работа с документами и базами знаний (RAG);
— поддержка системного промта для жёсткой настройки роли, стиля и ограничений диалога;
— модель стала прозрачнее: корректно сообщает об отсутствии знаний;
— улучшено понимание российских фактов и культурного контекста.
📈 Метрики качества:
— в 58% случаев ответы лучше прошлой версии;
— 56% преимуществ над GPT-4.1 (OpenAI);
— доля «хороших» ответов выросла с 60% до 71%;
— количество выдумок снизилось почти в 2 раза — до 16%.
💰 Стоимость снижена втрое: 40 коп. за 1000 токенов.
👍7😁7❤3🔥3🤔1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Чем хороша модель:
- 8B параметров - лёгкая для локального инференса.
- Средний балл 77.0 на OpenCompass - сводная оценка по 8 популярным бенчмаркам.
- По этим тестам обгоняет ряд проприетарных моделей уровня GPT-4o-latest и Gemini-2.0 Pro, а также сильный опенсорс Qwen2.5-VL 72B в задачах vision-language.
- Фактически самый результативный MLLM до 30B параметров.
Что соберём за сессию:
1) Мини-API для инференса - роут /chat с приемом текста и изображения.
2) Ультралёгкий фронт в anycoder - поле ввода, загрузка картинки, предпросмотр.
3) Набор промпт-темплейтов - описание изображения, OCR-вопросы, разбор скриншотов кода.
Где модель особенно заходит:
- Разбор скринов UI и PDF с таблицами.
- Вопросы по диаграммам и графикам.
- Помощь по коду по фотографиям экрана.
https://huggingface.co/spaces/akhaliq/MiniCPM-V-4_5
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2
На днях состоялась первая встреча AI VK & Pro — ивент по рекомендательным системам
Собралась буквально вся RecSys тусовка: много знакомых лиц из индустрии. Атмосфера в двух словах: глитч, стиль.
Судя по фоткам, нетворкинг процветает. На ивенте поделились взглядом на будущее рекомендательных систем, рассказали про технологии глубокого понимания контента и про единую рекомендательную платформу для всех продуктов VK.
🚀Весь вечер были DJ-сеты, разные активности и даже турнир по су-е-фа.
Собралась буквально вся RecSys тусовка: много знакомых лиц из индустрии. Атмосфера в двух словах: глитч, стиль.
Судя по фоткам, нетворкинг процветает. На ивенте поделились взглядом на будущее рекомендательных систем, рассказали про технологии глубокого понимания контента и про единую рекомендательную платформу для всех продуктов VK.
🚀Весь вечер были DJ-сеты, разные активности и даже турнир по су-е-фа.
👍4❤2🥰2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀Claudable!
Claudable — это мощный конструктор веб-приложений на базе Next.js, который позволяет создавать и развертывать приложения, просто описывая их идею. Используя возможности AI-агента Claude Code, вы мгновенно получаете рабочий код и живой превью вашего приложения.
🚀 Основные моменты:
- Генерация кода на основе естественного языка
- Мгновенный просмотр изменений с функцией горячей перезагрузки
- Легкое развертывание на Vercel с одним кликом
- Интеграция с Supabase для работы с базами данных
- Автоматическое обнаружение и исправление ошибок
📌 GitHub: https://github.com/opactorai/Claudable
Claudable — это мощный конструктор веб-приложений на базе Next.js, который позволяет создавать и развертывать приложения, просто описывая их идею. Используя возможности AI-агента Claude Code, вы мгновенно получаете рабочий код и живой превью вашего приложения.
🚀 Основные моменты:
- Генерация кода на основе естественного языка
- Мгновенный просмотр изменений с функцией горячей перезагрузки
- Легкое развертывание на Vercel с одним кликом
- Интеграция с Supabase для работы с базами данных
- Автоматическое обнаружение и исправление ошибок
📌 GitHub: https://github.com/opactorai/Claudable
❤8👍2🤔2🔥1
📊 Что внутри:
- 40 млрд обезличенных взаимодействий
- 20 млн единиц контента
- 10 млн пользователей
- период: январь–июнь 2025
- данные: лайки, дизлайки, шеры, время просмотра, реакции, контекст воспроизведения
- Гибко настраивать выборку по объёму
- Определять способ отбора — случайный или по популярности
- Подгонять датасет под доступные вычислительные ресурсы
Такой ресурс открывает новые горизонты для инженеров и исследователей по всему миру и поднимает планку в развитии рекомендательных технологий.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
AI VK Hub
Датасет VK-LSVD (Large Short-Video Dataset) для развития рекомендательных систем
Сейчас в открытом доступе не так много больших открытых датасетов, на базе которых инженеры и ученые могут обучать и оценивать модели. Для построения точных рекомендательных…
Сейчас в открытом доступе не так много больших открытых датасетов, на базе которых инженеры и ученые могут обучать и оценивать модели. Для построения точных рекомендательных…
❤4🔥3🥰1