Telegram Web
Новое исследование: меньше — значит лучше?

Авторы работы проверили, правда ли **Sparse Mixture of Experts (MoE)**-модели становятся лучше просто за счёт роста размера.

🔎 Сравнивали 8 открытых моделей на 10 бенчмарках в одинаковых условиях, проверяя результаты статистическими тестами.

Ключевые выводы
- 🏆 GPT-OSS 20B обошёл GPT-OSS 120B на MMLU и HumanEval.
- 20B требует в 5 раз меньше GPU-памяти и на 2.6 раза меньше энергии на ответ.
- 20B даёт более короткие и точные ответы, а 120B часто проигрывает из-за неэффективного роутинга или обучения.
- Обе модели сильны в генерации кода, но слабы на китайских задачах.

Практическое значение
- Для английского кода и структурных рассуждений выгоднее использовать 20B — выше пропускная способность и ниже задержка.
- Для многоязычных и профессиональных доменов преимущества не так очевидны.

📄 Paper: arxiv.org/abs/2508.12461
👍64🔥2🥰1
⚡️Qoder — бесплатный ИИ-редактор кода от Alibaba

Разработчики называют его платформой для кодинга «нового поколения». Qoder понимает всю кодовую базу, разбивает задачу на шаги, запоминает твой стиль и самое классное — модель подбирается автоматически в зависимости от задачи.

Есть еще Quest Mode: описываешь задачу, а Qoder сам пишет спецификацию, планирует и выполняет изменения по коду.

https://qoder.com/
👍65🔥3🤬2😁1
Forwarded from Machinelearning
⚡️ Google готовится к запуску модели Nano Banana.

По слухам, которые появились из-за поста инженера DeepMind Патрика Лоебера в сети Х, на этой неделе мы увидим инпейнт-модель для редактирования изображений под названием Nano Banana.

Модель наделала шуму на Lmarena, да и тестеры предварительных версий отмечают способность вносить очень точечные изменения в изображение, не затрагивая другие его элементы.

При этом качество изображений, генерируемое Nano Banana сопоставимо с результатами более крупных и ресурсоемких систем.

Официально Google пока не объявляла дату запуска и не раскрывала информацию о ценах.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
📉 MIT: 95% AI-пилотов проваливаются

MIT опубликовали отчёт, который напугал инвесторов:
🔴 95% проектов по внедрению GenAI не дают никакой отдачи.
Лишь 5% компаний получают результат — потому что делают иначе:
- интегрируют ИИ прямо в рабочие процессы,
- дают системам возможность учиться и адаптироваться,
- улучшают их на основе реального использования.

А большинство компаний повторяет ошибку — покупают “статичные” решения, которые эффектно смотрятся на демо, но в реальности:
- не помнят контекст,
- не подстраиваются под задачи,
- не помогают в ежедневной работе.

🧪 Как MIT изучали проблему
- проанализировали 300+ кейсов внедрения,
- провели 52 интервью,
- собрали 153 опроса у топ-менеджеров (январь–июнь 2025).

Вывод: успех дают не красивые пилоты, а живые системы, встроенные в бизнес.

🟢Подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍3🔥3
Media is too big
VIEW IN TELEGRAM
🆕 GeoSAM2 — новый уровень интерактивной 3D-сегментации

Теперь можно выделять части 3D-моделей простыми 2D-кликами или рамками на изображении, а система автоматически проецирует выделение на весь объект.

Особенности:
- Интерактивность: клики вместо сложных текстов.
- Точность: выделение как крупных, так и мелких деталей.
- Эффективность: без переобучения на каждом объекте.
- Лидерство на бенчмарках PartObjaverse-Tiny и PartNetE.

🚀 Подходит для дизайнеров, геймдева и робототехники, где важна точная работа с деталями 3D-объектов.

🔗 Демка: https://detailgen3d.github.io/GeoSAM2/
👍5🔥32
🔹 Современные LLM способны решать широкий круг задач — от генерации кода до подготовки аналитических отчётов.

Но на практике многие сталкиваются с тем, что ответы модели слишком общие, неточные или требуют значительной доработки.

Причина в том, что результат напрямую зависит от формулировки запроса.
Грамотный промт превращает LLM из «демонстрации технологий» в рабочий инструмент, который экономит время и снижает количество ошибок.

📘 На Stepik доступен курс
«Prompt Engineering: искусство работы с ИИ»

Что вы освоите:

* методы составления чётких и воспроизводимых запросов;
* управление форматом вывода (код, JSON, таблицы, структурированные тексты);
* построение последовательных цепочек промтов для комплексных задач;
* практические подходы к проверке и улучшению качества ответов модели;
* примеры применения в IT, аналитике, управлении и образовании.

🎯 Формат курса: концентрированные уроки с обязательной практикой.

🎓 По итогам — сертификат Stepik и собственный набор рабочих промтов, готовых к применению в реальной работе.

В течение 48 часов действует скидка 25%

👉 Пройти курс на Stepik
5🔥4👍3👎1😁1
🎉 Open-Fiesta: AI Chat Playground

Open-Fiesta — это открытая платформа для общения с ИИ, построенная на Next.js. Она позволяет переключаться между различными моделями и провайдерами, сравнивать их результаты и использовать веб-поиск и вложения изображений.

🚀 Основные моменты:
- Поддержка нескольких провайдеров (Gemini, OpenRouter и др.)
- Выбор до 5 моделей для одновременного использования
- Встроенный веб-поиск для каждого сообщения
- Поддержка вложений изображений
- Удобный интерфейс с нормализацией API

🟣 Ссылка: https://github.com/NiladriHazra/Open-Fiesta
testauopost
🔥53🥰2🤔1
🔥 Нашёл классный ресурс по истории ИИ

Оказывается, статьи в духе *«AI замедляется»* выходят уже много лет подряд.

Теперь появился сайт, где собрали все эти «думерские» публикации в одном месте.

Интересно пролистать и посмотреть, как регулярно предсказывали «конец прогресса» в ИИ.

aislowdown.replit.app
3🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
10–11 сентября встречаемся на IT Elements — конференции, сделанной айтишниками для айтишников.

Площадка в третий раз станет точкой притяжения тех, кто реально делает ИТ в России. В этом году в фокусе — всё самое важное: инфраструктура, сети, кибербезопасность, и впервые — отдельный трек по Data & AI!

Крупнейшие игроки рынка будут обсуждать, где заканчивается хайп и начинается реальная польза от ИИ.

▪️Корпоративный ИИ: как внедрять GPT-модели, AI-ассистентов и цифровых двойников в крупный бизнес.

▪️AI в маркетинге: как нейросети анализируют данные клиентов и предсказывают спрос.

▪️DataOps & MLOps: как устроены цифровые фабрики данных и как DevOps, MLOps и DataOps работают вместе.

▪️Big Data → Big Value: как из данных в промышленности извлекать реальную ценность.

Формат: офлайн (Москва) или онлайн.

Участие бесплатное, по предварительной регистрации.
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Tencent выпустила HunyuanVideo-Foley — открытую систему, которая умеет автоматически превращать видео и текст в качественный звук (Text-Video-to-Audio, TV2A).

🔊 Модель может автоматически генерировать профессиональный звук, который точно совпадает с картинкой и смыслом происходящего.

Главное:
- Универсальность — обучена на 100 000+ часов данных, создаёт звук для любых сцен: от природы до мультфильмов.
- Согласованность текста и видео — новая архитектура *MMDiT* учитывает одновременно изображение и описание, создавая многослойные эффекты: и главный звук, и фоновое окружение.
- Качество студийного уровня — благодаря функции потерь *REPA* и *Audio VAE* звук получается чистым и стабильным, без шумов и артефактов.

📈 На тестах HunyuanVideo-Foley показала лучшие результаты среди открытых моделей: более качественный звук, точная синхронизация с картинкой и учёт контекста сцены.

👉 Попробовать: https://hunyuan.tencent.com/video/zh?tabIndex=0
🌐 Project Page: https://szczesnys.github.io/hunyuanvideo-foley/
🔗 Code: https://github.com/Tencent-Hunyuan/HunyuanVideo-Foley
📄 Report: https://arxiv.org/abs/2508.16930
🤗 Hugging Face: https://huggingface.co/tencent/HunyuanVideo-Foley

@data_analysis_ml
3🔥3
⚡️ YandexGPT 5.1 Pro — новая флагманская модель Яндекса для бизнеса

Yandex B2B Tech представила обновлённую генеративную модель, доступную в Yandex Cloud AI Studio.

🔹 Основные возможности:

— краткие и структурированные ответы для корпоративных сценариев;
— улучшенная работа с документами и базами знаний (RAG);
— поддержка системного промта для жёсткой настройки роли, стиля и ограничений диалога;
— модель стала прозрачнее: корректно сообщает об отсутствии знаний;
— улучшено понимание российских фактов и культурного контекста.

📈 Метрики качества:

— в 58% случаев ответы лучше прошлой версии;
— 56% преимуществ над GPT-4.1 (OpenAI);
— доля «хороших» ответов выросла с 60% до 71%;
— количество выдумок снизилось почти в 2 раза — до 16%.

💰 Стоимость снижена втрое: 40 коп. за 1000 токенов.
👍7😁73🔥3🤔1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
📈 Vibe coding: чат-приложение на MiniCPM-V 4.5 в anycoder

Чем хороша модель:
- 8B параметров - лёг
кая для локального инференса.
- Средний балл 77.0 на OpenCompass - сводная оценка по 8 популярным бенчмаркам.
- По этим тестам обгоняет ряд проприетарных моделей уровня GPT-4o-latest и Gemini-2.0 Pro, а также сильный опенсорс Qwen2.5-VL 72B в задачах vision-language.
- Фактически самый результативный MLLM до 30B параметров.

Что соберём за сессию:
1) Мини-API для инференса - роут /chat с приемом текста и изображения.
2) Ультралёгкий фронт в anycoder - поле ввода, загрузка картинки, предпросмотр.
3) Набор промпт-темплейтов - описание изображения, OCR-вопросы, разбор скриншотов кода.

Где модель особенно заходит:
- Разбор скринов UI и PDF с таблицами.
- Вопросы по диаграммам и графикам.
- Помощь по коду по фотографиям экрана.

https://huggingface.co/spaces/akhaliq/MiniCPM-V-4_5
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2
На днях состоялась первая встреча AI VK & Pro — ивент по рекомендательным системам

Собралась буквально вся RecSys тусовка: много знакомых лиц из индустрии. Атмосфера в двух словах: глитч, стиль.

Судя по фоткам, нетворкинг процветает. На ивенте поделились взглядом на будущее рекомендательных систем, рассказали про технологии глубокого понимания контента и про единую рекомендательную платформу для всех продуктов VK.

🚀Весь вечер были DJ-сеты, разные активности и даже турнир по су-е-фа.
👍42🥰2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀Claudable!

Claudable — это мощный конструктор веб-приложений на базе Next.js, который позволяет создавать и развертывать приложения, просто описывая их идею. Используя возможности AI-агента Claude Code, вы мгновенно получаете рабочий код и живой превью вашего приложения.

🚀 Основные моменты:
- Генерация кода на основе естественного языка
- Мгновенный просмотр изменений с функцией горячей перезагрузки
- Легкое развертывание на Vercel с одним кликом
- Интеграция с Supabase для работы с базами данных
- Автоматическое обнаружение и исправление ошибок

📌 GitHub: https://github.com/opactorai/Claudable
8👍2🤔2🔥1
🔥 AI VK выпустила VK-LSDV — один из самых больших датасетов коротких видео для всех, кто работает с рекомендательными системами. Он доступен на Hugging Face.

📊 Что внутри:  
- 40 млрд обезличенных взаимодействий  
- 20 млн единиц контента  
- 10 млн пользователей  
- период: январь–июнь 2025  
- данные: лайки, дизлайки, шеры, время просмотра, реакции, контекст воспроизведения  

🟢 Вы можете:  
- Гибко настраивать выборку по объёму  
- Определять способ отбора — случайный или по популярности  
- Подгонять датасет под доступные вычислительные ресурсы  

⚡️ Главное:  
🟠Это один из крупнейших открытых датасетов коротких видео, полезный для обучения и тестирования систем рекомендаций  
🟠 Дает возможность работать с реальными данными  
🟠 VK-LSDV — вклад в создание исследовательской среды для тестирования гипотез и развития алгоритмов персонализации  

Такой ресурс открывает новые горизонты для инженеров и исследователей по всему миру и поднимает планку в развитии рекомендательных технологий.
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥3🥰1
2025/09/20 22:31:14
Back to Top
HTML Embed Code: