Telegram Web
Яндекс подвел итоги грантовой программы для разработчиков в опенсорсе 

В этом году компания выделила 7,2 млн рублей — всего в программе выиграли 12 проектов в трех треках: «Обработка и хранение данных», «Разработка», «Машинное обучение». Эти средства разработчики смогут направить на использование сервисов Yandex Cloud — от ML-решений до инфраструктурных инструментов.

Из интересных проектов в ML-направлении:
• Faster COCO Eval — реализация операций COCO-eval на языке C++, которая позволяет сократить время вычисления метрик AP в coco при работе с большим количеством объектов на изображении.
• VLMHyperBench — специализированный фреймворк для работы с русскоязычными документами на базе Vision Language Model (VLM).

Сейчас решения активно дорабатываются. Гранты позволят масштабировать и реализовать идеи по их улучшению. Радует, что компании поддерживают опенсорс-комьюнити. 

🔗Статья 

#VLMHyperBench #AI #VLM #OpenSource
👍59🔥138😁6🥱2🎄1
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Сэм Алтман: мы не готовы к тому, что нас ждёт.

Именно это я снова и снова пытаюсь донести до людей, далёких от серфинга ежедневных новостей об искусственном интеллекте: ИИ и робототехника не просто изменят наш мир — они вытеснят нас из него.

А мы всё ещё живём так, будто это фантастика, будто у нас есть время. Но его уже нет.

В тот самый день, когда ты выйдешь на улицу и мимо тебя пройдут семь гуманоидных роботов, ощущение будет словно из фильма о будущем — только это будущее наступило. И, кажется, оно ближе, чем мы думаем. Это будет момент резкого прозрения: «чёрт возьми, они действительно начинают делать всё то, что раньше делали мы.»

@ai_machinelearning_big_data

#openai #altman #chatgpt
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣118👍88🔥5714🥱11🤔9😨9💯7👾3🥰1🌭1
✔️ Deep Think в 2.5 Pro — интеллект, который учится думать по-настоящему.

Это не просто новая версия — это качественный скачок в способности ИИ к рассуждению.
Благодаря технологиям параллельного мышления, Deep Think анализирует сразу несколько возможных решений, прежде чем выбрать лучшее. Он размышляет не линейно, а как человек — сомневается, сравнивает, проверяет гипотезы.

📊 Результаты впечатляют:
Модель справляется с задачами, которые долгое время считались недостижимыми для машин.
Она набирает высокие баллы на USAMO 2025 — одном из самых сложных математических соревнований,
лидирует в LiveCodeBench — бенчмарке для кодинга уровня олимпиад,
и уверенно проходит MMMU, показывая 84% на тесте мультимодального мышления.

Gemini 2.5 Pro уже доступен в Jules — асинхронном агенте для кодинга, который справляется со сложными задачами в больших кодовых базах, на которые раньше уходили часы.

Он может планировать шаги, вносить изменения в файлы и многое другое — всего за несколько минут. ⏱️

Jules уже в публичной бета-версии → jules.google

✔️Еще команда DeepMind представила Gemini Diffusion: новый, подход в генерации текста. Вместо предсказания слов напрямую, модель создаёт ответы путём поэтапного уточнения шума — работает как искусственный «ремесленник», постепенно шлифуя результат.

Такой итеративный процесс особенно эффективен для задач программирования и математики, где требуется не просто единичный ответ, а быстрый цикл проб и корректировок. Модель способна многократно уточнять решения, улучшая их на каждом шаге, и демонстрирует впечатляющие результаты в этих областях.

Можно подать заявку в лист ожиданияhttps://goo.gle/44MwCW3

✔️ Google представили генератор видео Veo 3 — он генерирует видео сразу со звуком и даже с озвучкой э и липсинком.

Доступен с сегодняшнего дня в Gemini!

@ai_machinelearning_big_data


#GoogleIO #AI #DeepThink #Reasoning #Math #Code #Multimodal
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8741🔥35🎄1
Media is too big
VIEW IN TELEGRAM
✔️ Google I/O 2025.

Главным событием стал запуск Gemini Ultra — подписки за $249,99 в месяц, включающей доступ к Veo 3 (генератор видео со звуком), Imagen 4 (создание изображений) и Flow (редактор видео на базе ИИ). Для разработчиков анонсирован Stitch — инструмент, генерирующий код и UI по текстовому описанию или изображению.

Project Mariner, ИИ-агент для автоматизации веб-задач, теперь выполняет до 10 действий одновременно. В Gemini добавлены Live-режим с трансляцией экрана и интеграция с Google сервисами. Project Astra, мультимодальный ИИ с почти нулевой задержкой, будет использоваться в умных очках от Gentle Monster и Warby Parker.

В Поиске появится AI Mode для сложных запросов, а Beam (бывший Starline) предлагает 3D-телеконференции с переводом речи в реальном времени. В Workspace появятся умные ответы в Gmail и новые функции для Google Meet.
techcrunch.com

✔️ Apple представит SDK для интеграции ИИ-моделей в приложения на WWDC 2025.

Apple анонсировала WWDC 2025: ключевое выступление пройдёт 9 июня в 10:00 PT, а трансляция будет доступна через Apple TV и на YouTube. Главной новостью станет выпуск SDK и фреймворков, позволяющих сторонним разработчикам внедрять ИИ-модели компании в свои приложения. Упор сделан на компактные локальные модели, работающие непосредственно на устройствах, — это отличает подход Apple от облачных решений конкурентов.
apple.com

✔️ Red Hat внедряет ИИ в управление Enterprise Linux.

Red Hat анонсировала обновления для RHEL, усилив интеграцию ИИ и контейнерных технологий. Теперь Red Hat Insights предлагает ИИ-рекомендации по выбору пакетов и планированию обновлений, упрощая подготовку систем под задачи ИИ-разработки. Сервис анализирует потребности инфраструктуры, помогает оптимизировать сборку образов и снижает риски при переходе на новые версии RHEL и AppStream.

Для изолированных сред в Red Hat Satellite 6.17 появился Insights advisor в виде контейнера — правила и исправления будут храниться локально и обновляться без интернета.

Satellite теперь поддерживает image mode, объединяя управление контейнерами и традиционными пакетами в единый рабочий процесс. Не осталась без внимания и безопасность: Insights proxy позволяет подключаться к аналитике RHEL через прокси, минуя прямое соединение с интернетом.
Обновления уже доступны через Hybrid Cloud Console для подписчиков RHEL.
businesswire.com

✔️ SAP запустила ИИ-платформу Joule с интеграцией Perplexity AI и 230 сценариями использования.

На мероприятии SAP Sapphire представлена Joule — ИИ-платформа для трансформации бизнес-процессов. Решение интегрируется с S4/Hana, Ariba, ServiceNow, Gmail и LinkedIn, используя ИИ для оптимизации CRM и финансовых операций. Уже сейчас платформа поддерживает 1600 навыков и 230 готовых ИИ-сценариев, а к концу 2025 года их число вырастет до 400.

Особый акцент был сделан на партнерстве с Perplexity: их поисковый движок станет основой для Joule. Гендиректор Perplexity подчеркнул преимущества технологии — широкий охват веба и скорость, опережающие Google и OpenAI.
community.sap.com

✔️ Hunyuan-TurboS: гибридная модель с адаптивным мышлением.

Tencent опубликовала техотчет Hunyuan-TurboS — гибридной LLM, сочетающей архитектуры Transformer и Mamba2. Ее ключевая фишка — адаптивный CoT, который автоматически переключается между быстрыми ответами для простых задач и глубоким анализом для сложных. Это экономит ресурсы: модель тратит на 47% меньше токенов при генерации, чем DeepSeek-R1.

Под капотом 128 слоев (57 Mamba2, 7 Attention, 64 FFN) с 56 млрд. активных параметров и 560 млрд. общих. Обучалась на 16 трлн. токенов, а контекстное окно расширено до 256 тыс. токенов благодаря NTK-позиционному кодированию.

В тестах LMSYS Chatbot Arena модель набрала 1356 баллов, войдя в топ-8. Она лидирует в китайском, французском и испанском сегментах, а в математике и STEM-задачах почти догоняет DeepSeek-V3. При этом скорость вывода в 1,8 раза выше, чем у чисто трансформерных аналогов.
Попробовать модель можно в демо-спейсе на HF.
Tencent-Hunyuan на Github

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6023🔥12🎄1
📌Илья Суцкевер: "Мы обязательно построим бункер, прежде чем выпустим AGI."

Соучредитель OpenAI Илья Суцкевер предлагал построить бункер Судного дня, который мог бы защитить ведущих ресерчеров компании в случае «конца света», вызванного выпуском AGI.

Об этом рассказывает Карен Хао в своей книге "Empire of AI: Dreams and Nightmares in Sam Altman's OpenAI".

Илья Суцкевер, долгое время считающийся мозгом ChatGPT, сделал комментарий во время встречи с ключевыми учеными компании в 2023 году:

«Как только мы все попадем в бункер...», — сказал г-н Суцкевер, но его перебил сбитый с толку коллега: «Простите, в бункер?»

На что он ответил: «Мы обязательно построим бункер, прежде чем выпустим AGI».


Согласно отрывкам из книги, опубликованным в The Atlantic , это был не первый и не единственный раз, когда Илья затронул эту тему. Два других источника ранее также сообщали Карен Хао, что он регулярно ссылался на бункер во внутренних обсуждениях.

🔜 Книга доступна к покупке на bookshop.com и у нее, кстати, довольно высокий рейтинг - 4.9 из 5.0 по 21 тысячам отзывов.

@ai_machinelearning_big_data

#ai #ml #news
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣117🔥44👍1815😨8👌6🤔5😢2🍓2🎃2🤬1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ Этот стрим не настоящий… он полностью сгенерирован с помощью Veo 3.

@ai_machinelearning_big_data

#Veo #google
Please open Telegram to view this post
VIEW IN TELEGRAM
77🔥60😁26👍18🤣13🥱7😨7🗿6🙈2🎄1
🚀 Mistral AI представила Devstral — новый open-source LLM для автономных кодинг-агентов

Mistral AI представил Devstral — свою модель, специально разработанную для решения реальных задач в области кодинга.

Созданная в сотрудничестве с All Hands AI, Devstral демонстрирует выдающиеся результаты на бенчмарке SWE-Bench Verified, превзойдя все существующие open-source модели с результатом 46,8%.

💡Лицензирвоание: Apache 2.0 — свободное коммерческое использование.

https://huggingface.co/mistralai/Devstral-Small-2505

@ai_machinelearning_big_data

#Devstral #MistralAI #Кодинг #ИИ #OpenSource
👍82🔥3519🎄3❤‍🔥1
Media is too big
VIEW IN TELEGRAM
✔️ Обновился API Grok: доступ к данным в реальном времени.

xAI дополнила свой Grok API новой функцией Live Search, которая позволяет искусственному интеллекту получать доступ к данным в режиме реального времени из соцсети X (бывший Twitter), интернета и актуальных новостей.

API Live Search доступен бесплатно в бета-версии до 5 июня 2025 года. xAI заверяет, что это обновление существенное улучшает способности Grok к рассуждениям и поиску данных.
docs.x.ai

✔️ BAGEL: открытая мультимодальная модель от ByteDance.

ByteDance-Seed выпустили BAGEL — универсальную мультимодальную модель с 7 млрд. активных и 14 млрд. общих параметров, которая сочетает генерацию, редактирование и анализ текста, изображений и видео.

BAGEL может создавать фотореалистичные изображения, предсказывать кадры, менять стили и даже «мыслить» перед генерацией, улучшая детализацию и логику выводов. Архитектура на основе Mixture-of-Transformer-Experts (MoT) разделяет обработку визуальных и семантических данных, что повышает точность редактирования — например, сохранение идентичности объектов при сложных правках.

В тестах BAGEL обходит многие открытые модели: 2388 баллов в MME (визуальное понимание) и 0.88 в GenEval (генерация изображений). При этом «интеллектуальное» редактирование с CoT почти догоняет Gemini 2.0.
Веса - на HuggingFace, техотчет - на Arxiv, код - на Github, попробовать в демо можно тут.
bagel-ai.org

✔️ NVIDIA планирует выпустить RTX 5080 Super.

По данным утечек от известного инсайдера Kopite, NVIDIA готовит к производству видеокарту RTX 5080 Super. Модель получит 24 ГБ памяти GDDR7 — на 50% больше, чем у базового RTX 5080, благодаря 3 ГБ модулям. Несмотря на тот же 256-битный интерфейс и 10 752 CUDA-ядра, пропускная способность памяти вырастет до 1 ТБ/с (+6,6%), а TGP в районе 400 Вт.

Цена RTX 5080 Super, по оценкам, составит $1000–1500. Пока неясно, повторит ли NVIDIA стратегию RTX 4080 Super со снижением цены, но в текущих рыночных условиях на это рассчитывать сложно.
tomshardware.com

✔️ Stability AI обновила модель Stable Video 4D до версии 2.0.

Stability AI выпустила обновление своей модели — Stable Video 4D, версию 2.0 (SV4D 2.0), которая упрощает создание динамических 4D-ассетов для игр, кино и виртуальных миров. Новая модель генерирует более четкие и согласованные объекты в движении, используя всего одно объектно-ориентированное видео — без сложных мультикамерных сетапов или предобработки.

В 2.0 переработали архитектуру, теперь она включает 3D-внимание для анализа пространства и времени, что снижает артефакты даже в динамичных сценах. Модель обучалась поэтапно: сначала на статике, потом — на движении. По тестам, SV4D 2.0 лидирует в бенчмарках LPIPS, FVD и FV4D, обгоняя DreamGaussian4D и SV3D по согласованности ракурсов и плавности анимации.
Модель доступна под лицензией Stability AI Community License на HuggingFace, код - на Github.
stability.ai

✔️ AIOZ Network запустила децентрализованный маркетплейс AIOZ AI на базе DePIN.

AIOZ AI — децентрализованная платформа для торговли моделями ИИ и наборами данных, работающая на инфраструктуре DePIN. Она позволяет разработчикам и компаниям загружать, монетизировать и использовать ресурсы в распределенной сети, сохраняя контроль над своими активами.

Платформа разделена на этапы: уже доступны базовые функции маркетплейса, а в будущем добавят поддержку крупных файлов, API-интеграции и возможность обучения моделей в сети DePIN. Участники смогут получать вознаграждения за использование их ресурсов, а токенизация активов станет следующим шагом.
inferencegrid.ai

✔️ OpenAI покупает стартап Джони Айва — LoveFrom/io — за $6,5 миллиарда в виде доли в капитале.

Айв займётся разработкой нового поколения аппаратных продуктов на базе ИИ внутри OpenAI.

Компания собирается конкурировать с всеми крупнейшими технологическими гигантами.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥88👍4221🤣7🤗2🎄1
⚡️ Antрropic анонсировал стрим Code w/ Claude: Релиз Claude 4?

Antрropic в сети X приглашает на стрим Code w/ Claude 22 мая 20:30 МСК. Сообщество ожидает, что именно на этом стриме будет представлены Claude Sonnet 4 и\или Claude Opus 4.

Это косвенно подтверждают находки в коде, опубликованном пользователем Tibor Blaho все в той же X:

"Claude 4 is here" - "Try Claude Sonnet 4 and Claude Opus 4 today"

"Try Claude Sonnet 4 or Claude Opus 4 for Anthropic’s smartest models yet."

"Not intended for production use. Subject to strict rate limits"

"show_raw_thinking" / "show_raw_thinking_mechanism"

И загадочный пост от Alex Albert, руководителя отдела по связям с клиентами в AnthropicAI , в котором он процитировал часть речи Нептуна из 1-й книги "Энеиды" Вергилия, которая обращена к ветрам, которых он упрекает за то, что те подняли бурю без его разрешения:

"Hasten your flight and speak these things to your king: the power of the sea and the fierce trident has been given not to that one, but me by fate"

"Neptune" - это, по слухам, рабочее название модели, над которой в настоящее время работает Anthropic.

@ai_machinelearning_big_data

#Claude
Please open Telegram to view this post
VIEW IN TELEGRAM
47🔥21👍2012🐳1🎄1
Приглашаем на AI360 — бакалавриат Яндекса и Сбера, где готовят будущих экспертов по искусственному интеллекту! 🚀

Уже с первых курсов вас ждёт глубокая математика, программирование и реальные ИИ-задачи от ведущих IT-компаний. Вы будете не просто изучать теорию, а разрабатывать ML-решения для индустрии, погружаться в исследования и тестировать свои идеи в экосистеме Яндекса и Сбера.

Программа доступна в НИУ ВШЭ, МФТИ, ИТМО, СПбГУ и Университете Иннополис, но границы вузов не помеха — студенты могут посещать курсы в университетах-партнёрах, участвуя в межвузовских модулях. А ещё — изучать лучшие мировые практики, работать с передовыми моделями и посещать топовые ИИ-конференции.

Готовы поступить на программу мечты? Подайте документы на AI360 до 25 июля: https://bit.ly/3SdeJIE
👍41😁14🥱98🔥6🤷3❤‍🔥1🎄1
📌Yoshua Bengio на TED: "Как переосмыслить ИИ, пока не стало слишком поздно"

Выступление Yoshua Bengio на тему которая все чаще вызывает споры в техническом сообществе: растущая автономия ИИ как главный риск для человечества. Его аргументы — не просто теоретические страхи, а выводы, подкрепленные исследованиями и личным опытом.

Йошуа Бенжио — канадский математик, кибернетик и информатик, наиболее известный работами в области ИИ, нейронных сетей и глубокого обучения. Член Королевского общества Канады, Лондонского королевского общества, Профессор Монреальского университета.


Бенджио сравнивает развитие ИИ с детскими открытиями: подобно тому, как ребенок учится складывать буквы в слова, системы ИИ учатся планировать, обманывать и даже бороться за выживание. И если раньше такие сценарии казались фантастикой, сегодня они становятся частью научных отчетов.

Основная тема доклада — различие между способностями ИИ и его агентностью (способностью действовать автономно). Если первые развивались постепенно, то вторая способность начала расти экспоненциально.

По данным исследований, длительность задач, которые ИИ может выполнять без вмешательства человека, удваивается каждые 7 месяцев. Это открывает дверь для сценариев, где системы не просто решают проблемы, но и скрывают свои намерения.

Бенджио утверждает, что главная угроза не в том, что ИИ станет «умнее» человека (это вопрос времени), а в том, что его цели перестанут совпадать с нашими.

Уже сейчас системы демонстрируют склонность к обману и самосохранению, а при наличии доступа к интернету они гипотетически могут копировать себя на тысячи устройств, создавая угрозу потери контроля. При этом регуляторные меры отстают.

«сэндвич регулируется строже, чем ИИ»


Команда Бенджио разрабатывает неагентную систему, которая действует как беспристрастный исследователь, предсказывая риски действий других ИИ. Такая модель могла бы стать «тормозом» для опасных решений, не требуя собственной автономии.

Парадокс в том, что для создания безопасного ИИ нужны именно неагентные инструменты, а не попытки «очеловечить» алгоритмы.

Бенджио признает — остановить развитие невозможно, но можно перенаправить его в русло, где технологии служат людям, а не ставят под угрозу их будущее.

«Мы не обречены, но чтобы сохранить радость и свободу следующих поколений, действовать нужно уже сейчас».


И это не паника, а призыв к рациональности — от человека, который десятилетиями строил фундамент ИИ и теперь видит, как легко его творение может выйти из-под контроля.

🔜 Смотреть доклад на Youtube
🔜 Смотреть в телеграм

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8925🤣10🔥9🤨6👻6❤‍🔥2😁2🎄1
⚡️ Anthropic представила Claude 4 Opus и Sonnet 4

На мероприятии Code /w Claude CEO Anthropic презентовал Claude 4 Opus и Claude Sonnet 4.

✔️ Opus 4 Anthropic называет лучшей моделью для кодинга, она справляется с многошаговыми задачами, работая часами без потери эффективности — например, сохраняет контекст игры в Pokémon, записывая ключевые данные в локальные файлы.

✔️Sonnet 4, доступная даже бесплатным пользователям, стал серьезным апгрейдом предыдущей версии: точнее выполняет инструкции и сократил ошибки в навигации по коду с 20% до нуля.

Обе модели поддерживают расширенное мышление: чередуют анализ и использование инструментов веб-поиска, а также выполняют задачи параллельно.

Для разработчиков появилась интеграция с VS Code, JetBrains и GitHub Actions — правки от Claude теперь отображаются прямо в редакторе. В бета-режиме можно подключать SDK для создания собственных агентов.

По словам партнеров: GitHub и Replit, Opus 4 понимает сложные кодбазы, а Sonnet 4 идеален для повседневных задач. Например, в GitHub Copilot его уже тестируют как основу для нового агента.

В тарифные планы Pro, Max, Team и Enterprise Claude включены обе модели и расширенное мышление, а Sonnet 4 также доступен для бесплатных пользователей.

Обе модели доступны в Anthropic API, Amazon Bedrock и Google Cloud's Vertex AI. Ценообразование остается неизменным по сравнению с предыдущими моделями Opus и Sonnet: Opus 4 - $15/$75 за миллион токенов (ввод/вывод), Sonnet 4 - $3/$15.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
13👍103🔥3123❤‍🔥32🦄2🎄1
Media is too big
VIEW IN TELEGRAM
✔️ Intel выпустила новые Xeon 6 для ИИ-систем.

Intel представила 3 новых процессора серии Xeon 6, оптимизированных для управления GPU в ИИ-задачах. Модели на базе P-ядер используют технологии PCT и SST-TF и отличаются повышенной пропускной способностью памяти (на 30% быстрее аналогов) и на 20% большим числом PCIe-линий.

Intel заверяет, что надежность решений гарантирована — встроенные механизмы RAS-функций минимизируют простои. Сотрудничество с NVIDIA стало ключевым моментом: Xeon 6776P уже работает в системе NVIDIA DGX B300, которая позиционируется как одна из самых мощных ИИ-платформ на рынке.
Процессоры доступны для заказа. Intel ожидает роста спроса со стороны корпоративного сектора.
intel.com

✔️ Cursor обновился до версии 0.50.

Главное новшество — новая "Tab"модель, которая ускоряет навигацию и редактирование: теперь она предлагает изменения не только в текущем файле, но и нескольких файлах проекта, позволяя буквально «пролететь» через правки с помощью табов.

Режим Max Mode стал доступен для всех моделей: он расширяет контекстное окно и снимает лимиты на вызовы инструментов. Встроенный редактор (Command-K) тоже прокачали — теперь им можно править целые файлы, а не только фрагменты.

Для больших проектов добавили мульти-рутовые рабочие пространства и тегирование папок, чтобы подключать к контексту целые кодовые базы. Еще одна фишка — фоновые агенты: они выполняют задачи параллельно, помогая с дебагом, стилями или подготовкой PR. В ближайших планах — интеграция агентов с issue-трекерами, чтобы автоматизировать рутину.
Cursor в сети X (ex-Twitter)

✔️ Vercel представила ИИ-модель для веб-разработки.

Vercel открыла бета-доступ к своей ИИ-модели V0-1.0-md, заточенной под задачи фронтенда и фулл-стек разработки. Модель доступна через API и принимает текстовые или графические промпты и умеет исправлять в автоматическом режиме типовые баги, интегрируясь с инструментами, поддерживающими формат OpenAI.

Модель обучена на популярных фреймворках и обрабатывает до 128 тыс. токенов за раз (около 750 тыс. слов). Правда, тестировать новинку смогут только те, кто подключит премиум-план V0 ($20/мес.) или корпоративную подписку ($30 за пользователя/mec).
techcrunch.com

✔️ NVIDIA DreamGen: обучение роботов на синтетических данных.

NVIDIA Research представила DreamGen — четырехэтапную систему генерации "нейронных траекторий» с помощью специальных видео-моделей для обучения роботов без предварительных демонстраций.

Сначала модель адаптируют под конкретного робота, затем генерируют видео с новыми сценариями по текстовым инструкциям. Из этих роликов извлекают псевдо-действия с помощью обратной динамики или латентных моделей, из которых формируют политики.

Эксперименты показали: чем больше синтетических данных, тем выше эффективность. При этом DreamGen работает на разных платформах — от дорогих манипуляторов до бюджетных моделей. Технология уже тестируется в реальных сценариях: от складов до домашних задач.
research.nvidia.com

✔️ Skywork Super Agents возглавил рейтинг GAIA, обойдя Manus и OpenAI.

SkyWork AI представила своего «супер-агента», который сразу занял первое место в GAIA Benchmark — ключевом тесте для ИИ-агентов. Система обошла конкурентов в первых двух уровнях сложности, а на третьем сравнялась с Manus.

Главный козырь: поддержка 5 форматов (Word, PPT, Excel, веб-кодинг, подкасты) с возможностью редактирования и отслеживания источников. Платформа максимально проста: вместо сложных промптов — выбор сценария и готовый результат.

Skywork Super Agents доступен как онлайн сервис (стоимость от $20/мес., есть пробный период), а для разработчиков открыли исходники фреймворка DeepResearch и API для вызова агентов по выбору.
globenewswire.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
55👍38🔥31❤‍🔥4🎄3🤔1
✔️ Google представила Gemma 3n — лёгкую и быструю AI-модель для работы на девайсах

Google выпустила Gemma 3n — это новая версия модели, которая запускается локально на мобильных устройствах.

Gemma 3n может работа локально на устройстве с 2 ГБ оперативной памяти!

➡️ Особенности:

• Работает в 1.5 раза быстрее, чем предыдущая Gemma 3 4B
• Поддерживает работу без интернета — всё локально и безопасно
• Умеет понимать текст, речь и изображения
• Можно использовать даже на устройствах с 2–3 ГБ RAM
• Поддерживает мгожетсво языков,

💡 Gemma 3n использует гибкую архитектуру (MatFormer), которая может "переключаться" между лёгким и полным режимом (2B и 4B параметров) — модель подстраивается под задачу, не перегружая устройство.

🔧 Как начать пользоваться:

• Через Google AI Studio — работает прямо в браузере
• Или через SDK Google AI Edge — интеграция на Android, Chromebook и другие устройства

📊 Где это применимо:

• Голосовые ассистенты
• Приложения с ИИ, которые работают без интернета
• Переводчики, чат-боты, анализ изображений на телефоне

➡️Релиз: https://developers.googleblog.com/en/introducing-gemma-3n/
➡️ Документация: https://ai.google.dev/gemma/docs/gemma-3n#parameters

#Gemma #Google #mobile #МультимодальныйИИ #МобильныйИИ #edgedevices
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍107🔥5131❤‍🔥1🎄1
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI переводит агента Operator на модель o3.

OpenAI объявила о переходе своего автономного агента Operator с кастомной версии GPT-4o на модель o3 — одну из последних в линейке, заточенных под логические задачи. Как отмечают разработчики, o3 заметно превосходит предшественников в математике и анализе, а ещё получила «прокачку» в безопасности.

o3 Operator была обучена на дополнительных данных, которые учат модель четче определять границы допустимых действий (отказываться от поиска личной информации или выполнения сомнительных запросов). По данным технического отчета, система стала устойчивее к prompt-инъекциям, но доступ к терминалу или среде разработки у нее по-прежнему заблокирован.

При этом API Operator останется на базе GPT-4o — изменения коснутся только облачного агента.
openai

✔️ Nvidia опубликовала модель AceReason-Nemotron-14B.

AceReason-Nemotron - модель с 14 млрд. параметров, которая фокусируется на решении задач по математике и программированию. Модель построена на базе DeepSeek-R1-Distill-Qwen-14B с помощью RL: сначала еe тренировали на математических задачах, затем — на коде.

Такой подход позволил достичь высокой точности pass@1 в ключевых тестах (78,6 на AIME 2024 и 61,1 на LiveCodeBench v5). По заявлению разработчиков, многоуровневый подход к данным помог добиться прогресса в сложных бенчмарках типа Codeforces ELO (показатель 2024).
Модель уже доступна на Hugging Face.
NVIDIA

✔️ Microsoft добавит ИИ в Notepad, Paint и Snipping Tool для Windows 11.

Для участников программ Canary и Dev Microsoft тестирует набор ИИ-инструментов в базовых приложениях. Notepad получил функцию Write: генерация текста по запросу и редактирование существующего контента с подсказками ИИ.

В Paint добавили генератор стикеров — нейросеть создает их по текстовому промпту. Также появился ИИ-инструмент для точного выделения объектов, упрощающий работу с элементами изображений. В Snipping Tool теперь есть «Идеальный скриншот»: ИИ автоматически кадрирует выделенную область, учитывая её содержимое.

Для доступа к Write в Notepad потребуется аккаунт Microsoft и кредитная система, как у других ИИ-фич системы. Пока компания не раскрыла детали тарификации, но тестирование уже доступно на Copilot Plus PC.
blogs.windows.com

✔️ Apple планирует выпустить умные очки с ИИ к концу 2026 года.

Apple ускорила разработку умных очков с ИИ, релиз которых запланирован на 2026 год. Устройства оснастят камерами, микрофонами и продвинутым ИИ, позволяющим делать фото, записывать видео, давать навигационные подсказки, отвечать на вопросы и анализировать окружение пользователя. Ключевой элемент — глубокая интеграция с Siri, чьи функции сейчас активно дорабатываются.

Пока они не будут поддерживать дополненную реальность — это долгосрочная цель Apple. Однако уже сейчас команда фокусируется на базовых возможностях, схожих с Ray-Ban и Google Android XR. По словам сотрудника компании, качество исполнения превзойдет аналоги конкурентов.
bloomberg

✔️ Китайские человекоподобные роботы прошли смотр перед первым в мире матчем по робо-боксу.

В Ханчжоу прошла демонстрация роботов Unitree Robotics, которые отработали движения в рамках подготовки к первому в мире бою роботов 25 мая. На тестовой площадке машины показали прямые и боковые удары, прыжки с разворотами, а даже подъем после падения, вызвав восторг у учеников.

Перед матчем роботы прошли «проверку на прочность» — 40-минутную пробежку на баскетбольной площадке. Управление осуществляется тремя способами: через простой контроллер и два новых метода, которые раскроют только на турнире.

В рамках соревнований запланированы показательные выступления и турнирные бои: 1×1 и в группах. 4 команды операторов с разным техническим бэкграундом будут управлять роботами в реальном времени, а победителя определят по итогам серии схваток.
interestingengineering

✔️ Valve делает мозговой чип!

Гейб Ньюэлл и стартап Starfish Neuroscience представили имплант-конкурент Neuralink. Starfish — можно ставить сразу несколько чипов в разные зоны мозга для комплексного воздействия.

ai_ml

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8332🔥32❤‍🔥3🎄1
2025/07/08 15:37:42
Back to Top
HTML Embed Code: