Telegram Web
⚡️Qoder — бесплатный ИИ-редактор кода от Alibaba

Разработчики называют его платформой для кодинга «нового поколения». Qoder понимает всю кодовую базу, разбивает задачу на шаги, запоминает твой стиль и самое классное — модель подбирается автоматически в зависимости от задачи.

Есть еще Quest Mode: описываешь задачу, а Qoder сам пишет спецификацию, планирует и выполняет изменения по коду.

https://qoder.com/
👍65🔥3🤬2😁1
Forwarded from Machinelearning
⚡️ Google готовится к запуску модели Nano Banana.

По слухам, которые появились из-за поста инженера DeepMind Патрика Лоебера в сети Х, на этой неделе мы увидим инпейнт-модель для редактирования изображений под названием Nano Banana.

Модель наделала шуму на Lmarena, да и тестеры предварительных версий отмечают способность вносить очень точечные изменения в изображение, не затрагивая другие его элементы.

При этом качество изображений, генерируемое Nano Banana сопоставимо с результатами более крупных и ресурсоемких систем.

Официально Google пока не объявляла дату запуска и не раскрывала информацию о ценах.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
📉 MIT: 95% AI-пилотов проваливаются

MIT опубликовали отчёт, который напугал инвесторов:
🔴 95% проектов по внедрению GenAI не дают никакой отдачи.
Лишь 5% компаний получают результат — потому что делают иначе:
- интегрируют ИИ прямо в рабочие процессы,
- дают системам возможность учиться и адаптироваться,
- улучшают их на основе реального использования.

А большинство компаний повторяет ошибку — покупают “статичные” решения, которые эффектно смотрятся на демо, но в реальности:
- не помнят контекст,
- не подстраиваются под задачи,
- не помогают в ежедневной работе.

🧪 Как MIT изучали проблему
- проанализировали 300+ кейсов внедрения,
- провели 52 интервью,
- собрали 153 опроса у топ-менеджеров (январь–июнь 2025).

Вывод: успех дают не красивые пилоты, а живые системы, встроенные в бизнес.

🟢Подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍3🔥3
Media is too big
VIEW IN TELEGRAM
🆕 GeoSAM2 — новый уровень интерактивной 3D-сегментации

Теперь можно выделять части 3D-моделей простыми 2D-кликами или рамками на изображении, а система автоматически проецирует выделение на весь объект.

Особенности:
- Интерактивность: клики вместо сложных текстов.
- Точность: выделение как крупных, так и мелких деталей.
- Эффективность: без переобучения на каждом объекте.
- Лидерство на бенчмарках PartObjaverse-Tiny и PartNetE.

🚀 Подходит для дизайнеров, геймдева и робототехники, где важна точная работа с деталями 3D-объектов.

🔗 Демка: https://detailgen3d.github.io/GeoSAM2/
👍5🔥32
🔹 Современные LLM способны решать широкий круг задач — от генерации кода до подготовки аналитических отчётов.

Но на практике многие сталкиваются с тем, что ответы модели слишком общие, неточные или требуют значительной доработки.

Причина в том, что результат напрямую зависит от формулировки запроса.
Грамотный промт превращает LLM из «демонстрации технологий» в рабочий инструмент, который экономит время и снижает количество ошибок.

📘 На Stepik доступен курс
«Prompt Engineering: искусство работы с ИИ»

Что вы освоите:

* методы составления чётких и воспроизводимых запросов;
* управление форматом вывода (код, JSON, таблицы, структурированные тексты);
* построение последовательных цепочек промтов для комплексных задач;
* практические подходы к проверке и улучшению качества ответов модели;
* примеры применения в IT, аналитике, управлении и образовании.

🎯 Формат курса: концентрированные уроки с обязательной практикой.

🎓 По итогам — сертификат Stepik и собственный набор рабочих промтов, готовых к применению в реальной работе.

В течение 48 часов действует скидка 25%

👉 Пройти курс на Stepik
5🔥4👍3👎1😁1
🎉 Open-Fiesta: AI Chat Playground

Open-Fiesta — это открытая платформа для общения с ИИ, построенная на Next.js. Она позволяет переключаться между различными моделями и провайдерами, сравнивать их результаты и использовать веб-поиск и вложения изображений.

🚀 Основные моменты:
- Поддержка нескольких провайдеров (Gemini, OpenRouter и др.)
- Выбор до 5 моделей для одновременного использования
- Встроенный веб-поиск для каждого сообщения
- Поддержка вложений изображений
- Удобный интерфейс с нормализацией API

🟣 Ссылка: https://github.com/NiladriHazra/Open-Fiesta
testauopost
🔥53🥰2🤔1
🔥 Нашёл классный ресурс по истории ИИ

Оказывается, статьи в духе *«AI замедляется»* выходят уже много лет подряд.

Теперь появился сайт, где собрали все эти «думерские» публикации в одном месте.

Интересно пролистать и посмотреть, как регулярно предсказывали «конец прогресса» в ИИ.

aislowdown.replit.app
3🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
10–11 сентября встречаемся на IT Elements — конференции, сделанной айтишниками для айтишников.

Площадка в третий раз станет точкой притяжения тех, кто реально делает ИТ в России. В этом году в фокусе — всё самое важное: инфраструктура, сети, кибербезопасность, и впервые — отдельный трек по Data & AI!

Крупнейшие игроки рынка будут обсуждать, где заканчивается хайп и начинается реальная польза от ИИ.

▪️Корпоративный ИИ: как внедрять GPT-модели, AI-ассистентов и цифровых двойников в крупный бизнес.

▪️AI в маркетинге: как нейросети анализируют данные клиентов и предсказывают спрос.

▪️DataOps & MLOps: как устроены цифровые фабрики данных и как DevOps, MLOps и DataOps работают вместе.

▪️Big Data → Big Value: как из данных в промышленности извлекать реальную ценность.

Формат: офлайн (Москва) или онлайн.

Участие бесплатное, по предварительной регистрации.
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Tencent выпустила HunyuanVideo-Foley — открытую систему, которая умеет автоматически превращать видео и текст в качественный звук (Text-Video-to-Audio, TV2A).

🔊 Модель может автоматически генерировать профессиональный звук, который точно совпадает с картинкой и смыслом происходящего.

Главное:
- Универсальность — обучена на 100 000+ часов данных, создаёт звук для любых сцен: от природы до мультфильмов.
- Согласованность текста и видео — новая архитектура *MMDiT* учитывает одновременно изображение и описание, создавая многослойные эффекты: и главный звук, и фоновое окружение.
- Качество студийного уровня — благодаря функции потерь *REPA* и *Audio VAE* звук получается чистым и стабильным, без шумов и артефактов.

📈 На тестах HunyuanVideo-Foley показала лучшие результаты среди открытых моделей: более качественный звук, точная синхронизация с картинкой и учёт контекста сцены.

👉 Попробовать: https://hunyuan.tencent.com/video/zh?tabIndex=0
🌐 Project Page: https://szczesnys.github.io/hunyuanvideo-foley/
🔗 Code: https://github.com/Tencent-Hunyuan/HunyuanVideo-Foley
📄 Report: https://arxiv.org/abs/2508.16930
🤗 Hugging Face: https://huggingface.co/tencent/HunyuanVideo-Foley

@data_analysis_ml
3🔥3
⚡️ YandexGPT 5.1 Pro — новая флагманская модель Яндекса для бизнеса

Yandex B2B Tech представила обновлённую генеративную модель, доступную в Yandex Cloud AI Studio.

🔹 Основные возможности:

— краткие и структурированные ответы для корпоративных сценариев;
— улучшенная работа с документами и базами знаний (RAG);
— поддержка системного промта для жёсткой настройки роли, стиля и ограничений диалога;
— модель стала прозрачнее: корректно сообщает об отсутствии знаний;
— улучшено понимание российских фактов и культурного контекста.

📈 Метрики качества:

— в 58% случаев ответы лучше прошлой версии;
— 56% преимуществ над GPT-4.1 (OpenAI);
— доля «хороших» ответов выросла с 60% до 71%;
— количество выдумок снизилось почти в 2 раза — до 16%.

💰 Стоимость снижена втрое: 40 коп. за 1000 токенов.
👍7😁73🔥3🤔1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
📈 Vibe coding: чат-приложение на MiniCPM-V 4.5 в anycoder

Чем хороша модель:
- 8B параметров - лёг
кая для локального инференса.
- Средний балл 77.0 на OpenCompass - сводная оценка по 8 популярным бенчмаркам.
- По этим тестам обгоняет ряд проприетарных моделей уровня GPT-4o-latest и Gemini-2.0 Pro, а также сильный опенсорс Qwen2.5-VL 72B в задачах vision-language.
- Фактически самый результативный MLLM до 30B параметров.

Что соберём за сессию:
1) Мини-API для инференса - роут /chat с приемом текста и изображения.
2) Ультралёгкий фронт в anycoder - поле ввода, загрузка картинки, предпросмотр.
3) Набор промпт-темплейтов - описание изображения, OCR-вопросы, разбор скриншотов кода.

Где модель особенно заходит:
- Разбор скринов UI и PDF с таблицами.
- Вопросы по диаграммам и графикам.
- Помощь по коду по фотографиям экрана.

https://huggingface.co/spaces/akhaliq/MiniCPM-V-4_5
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2
На днях состоялась первая встреча AI VK & Pro — ивент по рекомендательным системам

Собралась буквально вся RecSys тусовка: много знакомых лиц из индустрии. Атмосфера в двух словах: глитч, стиль.

Судя по фоткам, нетворкинг процветает. На ивенте поделились взглядом на будущее рекомендательных систем, рассказали про технологии глубокого понимания контента и про единую рекомендательную платформу для всех продуктов VK.

🚀Весь вечер были DJ-сеты, разные активности и даже турнир по су-е-фа.
👍42🥰2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀Claudable!

Claudable — это мощный конструктор веб-приложений на базе Next.js, который позволяет создавать и развертывать приложения, просто описывая их идею. Используя возможности AI-агента Claude Code, вы мгновенно получаете рабочий код и живой превью вашего приложения.

🚀 Основные моменты:
- Генерация кода на основе естественного языка
- Мгновенный просмотр изменений с функцией горячей перезагрузки
- Легкое развертывание на Vercel с одним кликом
- Интеграция с Supabase для работы с базами данных
- Автоматическое обнаружение и исправление ошибок

📌 GitHub: https://github.com/opactorai/Claudable
8👍2🤔2🔥1
🔥 AI VK выпустила VK-LSDV — один из самых больших датасетов коротких видео для всех, кто работает с рекомендательными системами. Он доступен на Hugging Face.

📊 Что внутри:  
- 40 млрд обезличенных взаимодействий  
- 20 млн единиц контента  
- 10 млн пользователей  
- период: январь–июнь 2025  
- данные: лайки, дизлайки, шеры, время просмотра, реакции, контекст воспроизведения  

🟢 Вы можете:  
- Гибко настраивать выборку по объёму  
- Определять способ отбора — случайный или по популярности  
- Подгонять датасет под доступные вычислительные ресурсы  

⚡️ Главное:  
🟠Это один из крупнейших открытых датасетов коротких видео, полезный для обучения и тестирования систем рекомендаций  
🟠 Дает возможность работать с реальными данными  
🟠 VK-LSDV — вклад в создание исследовательской среды для тестирования гипотез и развития алгоритмов персонализации  

Такой ресурс открывает новые горизонты для инженеров и исследователей по всему миру и поднимает планку в развитии рекомендательных технологий.
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥3🥰1
👩‍💻 ControlFlow — это фреймворк Python для создания рабочих процессов в ИИ агентах!

💡 ControlFlow предоставляет структурированную, ориентированную на разработчиков среду для определения рабочих процессов и делегирования работы LLM без ущерба для контроля или прозрачности:

🌟 Создавайте отдельные, наблюдаемые задачи, над которыми будет работать ИИ.

🌟 Назначьте одного или нескольких специализированных агентов ИИ для каждой задачи.

🌟 Объединяйте задачи в поток, чтобы организовать более сложное поведение.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🔥2
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Следующая модель семейства LLama выйдет к концу этого года.

Разработкой занимается новое подразделение компании Марка Цукерберга Superintelligence Labs. Модель, которую некоторые внутри компании называют Llama 4.5, должна исправить недостатки предыдущих версий: слабую производительность в кодинге и логических рассуждениях. Параллельно команда работает над исправлением ошибок в уже выпущенных версиях Llama 4 и фоном допиливает флагманскую модель "Behemoth".
businessinsider.com

✔️ Apple опубликовала семейство моделей FastVLM.

FastVLM - линейка ультрабыстрых VL-моделей с гибридным энкодером FastViTHD, который значительно сокращает количество визуальных токенов и ускоряет их обработку. В сравнении с LLaVA-1.5, FastVLM показала в 3.2 раза более быстрый TTFT при сопоставимой производительности, а с LLaVa-OneVision модель достигает аналогичных результатов на бенчмарках, используя в 3.4 раза меньший энкодер.

В семейство входят три модели размером 500 миллионов, 1.5 миллиарда и 7 миллиардов параметров. Все они уже доступны на Hugging Face для некоммерческого использования.
huggingface.co

✔️ PixVerse запустила новую модель V5 для генерации видео.

Обновление принесло значительные улучшения в качестве движений, визуальной детализации, согласованности и точности исполнения текстовых запросов. Новая функция Agent позволяет создать 5–30-секундный ролик, просто загрузив одно фото.

Генерация видео в разрешении 360p занимает 5 секунд, а 1080p - около минуты. До 1 сентября 2025 года доступ к V5 предоставляется бесплатно. Модель работает через веб-интерфейс, мобильные приложения и API.
Pixverse в сети X

✔️ Google встроила Gemini CLI в редактор кода Zed.

Интеграция позволяет разработчикам генерировать и рефакторить код, а также общаться с ИИ, не покидая редактор. Изменения применяются в реальном времени и могут быть проверены в интерфейсе, похожем на pull-request.

Gemini работает через открытый протокол Agent Client Protocol, созданный Zed для связи ИИ-агентов со средами разработки. Zed основан на Rust и позиционируется как открытая альтернатива Microsoft VS Code.
developers.googleblog.com

✔️ В Финляндии разработали умную упаковку с ИИ-распознаванием.

Исследователи из Университета Ваасы предложили дешевую и экологичную альтернативу электронным датчикам для контроля состояния продуктов. Технология основана на использовании функциональных чернил, которые меняют цвет при изменении температуры или влажности, а сверточные нейронные сети с высокой точностью распознают даже малейшие изменения, которые не улавливают традиционные методы машинного зрения. Это решает проблему своевременного обнаружения порчи или повреждений.

Такие индикаторы можно наносить прямо на упаковку вместе с обычными этикетками, что почти не увеличивает стоимость. Технология может найти применение в пищевой промышленности и в фармацевтике для отслеживания условий хранения продукции.
interestingengineering.com

✔️ Скандал: xAI подала в суд на бывшего инженера

xAI обвиняет Xuechen Li в краже технологий Grok и попытке передать их OpenAI.
Факты:
- Продал акции xAI на $7 млн и уволился.
- Скопировал секретные файлы Grok на личное хранилище.
- Удалял логи и признался письменно.
xAI требует: вернуть и удалить данные, запретить Li работать над ИИ в OpenAI и выплатить компенсацию.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2🔥2
🚨 Новый отчёт от Epoch AI: GPT-5 значительно превосходит GPT-4

Хотя запуск GPT-5 прошёл тише, чем громкий дебют GPT-4, цифры показывают обратное — это снова огромный скачок, как когда-то между GPT-3 и GPT-4.

📊 Рост по ключевым бенчмаркам:
🧠 +67% на HumanEval
📚 +80% на Mock AIME
📈 +75% на продвинутой математике (Level 5 MATH)

Итог: GPT-5 подтверждает тренд — каждое поколение приносит качественный прорыв в возможностях моделей.

https://epoch.ai/data-insights/gpt-capabilities-progress
8👍6👎2👏1
2025/09/16 22:02:51
Back to Top
HTML Embed Code: