Telegram Web
Media is too big
VIEW IN TELEGRAM
✔️ В приложение Gemini добавили «запланированные действия».

Новая функция позволяет автоматизировать повторяющиеся задачи и получать персонализированные уведомления. Пользователи могут задавать команды, например, ежедневно присылать сводку календаря или идеи для блога, а также создавать разовые напоминания.

«Запланированные действия» активируется через настройки приложения. Система работает просто: достаточно описать задачу и указать время выполнения. Доступ к инструменту открыт для подписчиков Google AI Pro/Ultra и корпоративных пользователей Google Workspace (образовательные и бизнес-планы).
blog.google

✔️ Google меняет план доступа к AI Studio.

Все началось из за волны возмущения платных подписчиков поводу того, что в Gemini app платный Pro-тариф ($19.99) оказался строже, чем бесплатный AI Studio.

Google отреагировал увеличением лимитов для Gemini app, но параллельно объявил, что AI Studio полностью перейдет на авторизацию по API-ключам. Это напугало разработчиков, многие используют AI Studio в своих проектах. Они опасаются, что теперь придется платить за сервис.

Руководитель направления, Логан Килпатрик, успокоил сообщество: "Бесплатный уровень AI Studio никуда не денется в ближайшее время". Поменяется система учета. Пока большинство укладывалось в свободные квоты, но теперь, при их превышении, точно потребуется свой ключ и, возможно, оплата. Для тех, кому критичны большие квоты Gemini app, теперь нужен уже AI Ultra за $250/мес. Будущее бесплатного доступа в AI Studio прорабатывается, компания обещает минимизировать неудобства.
9to5google.com

✔️ Microsoft Photos получило новые ИИ-инструменты.

Microsoft выпустила обновление для Photos на Windows 11 с новыми фичами. Relight: позволяет управлять тремя источниками света, менять их цвет и фокус, есть готовые пресеты. Пока это работает только на Snapdragon-устройствах Copilot+, но вскоре поддержка дойдет до AMD и Intel.

Поиск по текстовому запросу: вводите «закат на пляже» или «семейный пикник», и приложение найдет подходящие фото без лишних кликов.

Коммерческие пользователи с Entra ID получили доступ к Restyle Image и Image Creator, ранее доступным только через личные аккаунты Microsoft. Обновление доступно в версии 2025.11060.5006.0 и выше.
blogs.windows.com

✔️ Apple на WWDC 2025 анонсировала улучшенные инструменты для разработчиков.

Foundation Models — фреймворк для создания интеллектуальных приложений с поддержкой офлайн-работы и приватностью данных. С ним можно добавлять ИИ-функции в приложения всего за три строки кода на Swift.

Xcode 26 получил интеграцию с ChatGPT и другими LLM, позволяя писать код, тесты и документацию через API-ключи или локальные модели на Mac с чипами Apple. Удобство повысилось за счет голосового управления, обновлённой навигации и локализации.

Swift 6.2 улучшил производительность и взаимодействие с C++ и JavaScript, а также получил поддержку WebAssembly. Контейнеризация для Mac теперь работает с Linux-образами благодаря изолированному опенсорсному фреймворку.
apple.com

✔️ Anthropic закрыла пилотный блог, который вел Claude.

Всего месяц просуществовал экспериментальный блог "Claude Explains", где Claude писал технические статьи. Инициатива, по задумке, должна была объединить обучающий контент с маркетинговыми целями, при участии редакторов и экспертов, дорабатывавших черновики Claude.

Блог освещал темы от анализа данных до оптимизации кода. Однако уже через месяц пилот остановили, хотя планы были грандиозные. Пользователи соцсетей критиковали неясность: часть постов выглядела как автоматизированный маркетинг, а отсутствие меток об ИИ-генерации вызывало недоверие.

Согласно сервису Backlink Checker, за месяц существования блога, на его статьи сослались 24 сайта. Вероятно, Anthropic решили дистанцироваться из-за рисков, связанных с ошибками ИИ. Сейчас с адреса блога установлено перенаправление на главную страницу Anthropic.
techcrunch.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
43👍35🔥6🥰3
📌Tokasaurus: проект для ускорения работы с языковыми моделями.

Tokasaurus — это движок инференса для языковых моделей в режиме высоконагруженных задач. Он максимизирует пропускную способность при работе с LLM, предлагает поддержку API OpenAI, эффективно управляет памятью и оптимизирует вычисления в сценариях, где важно одновременно обрабатывать множество запросов без задержек.

Архитектура Tokasaurus разделена на 3 компонента: веб-сервер, менеджер и модельные воркеры.

🟢Веб-сервер отвечает за взаимодействие с клиентами, принимая запросы и отправляя ответы.

🟢Менеджер, запущенный в отдельном процессе, управляет планированием задач, KV-кешем и группировкой последовательностей с общими префиксами.

🟢Модельные воркеры выполняют прямые запросы к подключенным LLM. Компоненты обмениваются данными асинхронно через очереди, и это позволяет держать GPU загруженным без простоев.

Проект учитывает растущую потребность в масштабировании и предлагает 3 типа параллелизма: дата-параллелизм (dp_size), пайплайн (pp_size) и тензорный (tp_size) с поддержкой AsyncTP.

Async Tensor Parallelism в PyTorch — это техника ускорения распределенных вычислений для LLM, где операции связи (all-gather/reduce-scatter) разбиваются на асинхронные части и перекрываются с матричными умножениями (matmul) с помощью чередующихся CUDA-потоков: пока один поток вычисляет фрагмент matmul, другой параллельно передаtт данные для следующего фрагмента через P2P-копирование (NVLink + copy engines), минимизируя простои GPU.


При использовании нескольких GPU, например, dp_size=2 и pp_size=4, система задействует 8 GPU, создавая 2 дублирующиеся группы по 4 GPU каждая. При этом параметры управления памятью (kv_cache_size_num_tokens, max_seqs_per_forward) применяются к каждой дата-параллельной группе отдельно. Это позволяет тонко управлять ресурсами, исходя из контекста конкретных нагрузок.

Tokasaurus поддерживает модели семейств Llama3 и Qwen2, использует технологию Hydragen для ускорения внимания над общими префиксами последовательностей.

⚠️ Проект пока молодой, поэтому некоторые функции могут быть нестабильными. Разработчики активно работают над улучшениями.


📌 Лицензирование: Apache 2.0 License.


🖥GitHub


@ai_machinelearning_big_data

#AI #ML #LLM # #Tokasaurus #Github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5122🔥12🥰6😨1
Вот как изменилась доля трафика на рынке ИИ за последние полгода:

🗓️ 6 месяцев назад:
🥇 ChatGPT: 87,5%
🥈 Google: 5,4%
🥉 Perplexity: 2,0%
Claude: 1,6%

🗓️ 3 месяца назад:
🥇 ChatGPT: 77,6% (−9,9%)
🥈 DeepSeek: 8,1% (новый игрок!)
🥉 Google: 4,9%
🤖 Grok: 2,7% (входит в игру от X)
🚀 Perplexity: 2,0%

🗓️ 1 месяц назад:
🥇 ChatGPT: 80,2% (+2,6%)
🥈 Google: 6,1% (+1,2%)
🥉DeepSeek: 5,9% (−2,2%)
🤖 Grok: 2,4%
🚀 Perplexity: 1,6%
Claude: 1,2%

🗓️ Сейчас:
🥇 ChatGPT: 78,9% (−1,3%)
🥈 Google: 8,0% (+1,9% 📈)
🥉 DeepSeek: 5,3% (−0,6%)
🤖 Grok: 2,1% (−0,3%)
🚀Perplexity: 1,7% (+0,1%)
Claude: 1,4% (+0,2%)

Главные выводы:
- ChatGPT по-прежнему лидирует, но понемногу теряет долю рынка (−8,6% за полгода).
- Google стабильно растёт (+2,6% с прошлого года).
- DeepSeek мощно стартовал, но в последнее время сдал позиции.
- Grok и Perplexity держатся, а Claude показывает небольшой рост.

@ai_machinelearning_big_data


#GenAI #ТрендыРынка
👍6635🔥15🥰3🌭1
⚡️ Mistral выпустила ризонинг-модель Magistral.

Magistral — первая модель рассуждений от Mistral AI. Она сочетает глубокую логическую обработку с возможностью отслеживать каждый шаг её «мышления».

Модель получила поддержку 8 языков, включая русский и выпущена в 2 вариантах:

🟢опенсорсный Magistral Small с 24 млрд. параметров;

🟠корпоративный Magistral Medium.

Внутри Magistral работает в режиме рассуждений, разбивая задачи на цепочки логических шагов, а Flash Answers ускоряет вывод в 10 раз по сравнению с конкурентами. Для интеграции в рабочие процессы модель умеет взаимодействовать с внешними инструментами (API или базами данных).

В тестах Magistral Medium показал 73,6% точности на задачах AIME2024, демонстрируя силу в физических симуляциях и математических расчетах.

Для разработчиков доступны версии на Hugging Face, AWS и IBM WatsonX, а в будущем — на Azure и Google Cloud. Демо Magistral доступно в интерфейсе Le Chat или по API в La Plateforme.


📌Лицензирование: Apache 2.0 License.


🟡Статья
🟡Модель
🟡Техотчет
🟡Web Demo


@ai_machinelearning_big_data

#AI #ML #LLM #Magistral #MistralAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
60👍22🔥14💯3🤔1
⚡️ Сэм Альтман анонсирует снижение стоимости на о3 на 80%

Гендир OpenAI объявил о снижении цены на o3 на 80% и намекнул на предстоящий выпуск o3-pro.

Говорит, что нам понравится соотношение цена\перфоманс у о3-pro.


Пост Sam Altman в сети Х
Please open Telegram to view this post
VIEW IN TELEGRAM
98👍43🔥18🐳6🌭4
🖥 Новая версия модели постепенно становится доступна всем пользователям подписки ChatGPT Pro и через API.

В экспертных оценках тестировщики отдают предпочтение OpenAI o3-pro по сравнению с o3.

https://x.com/OpenAI/status/1932530409684005048

@ai_machinelearning_big_data

#chatgpt #openai #o3pro
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
55👍28🔥17😢5🌭1
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI переходит к Google Cloud для расширения вычислительных мощностей.

OpenAI договорилась с Google Cloud о поставках вычислительных ресурсов для тренировки и запуска своих моделей - неожиданный шаг для конкурентов в сфере ИИ. Ранее OpenAI зависела от Microsoft Azure, но теперь диверсифицирует поставщиков, заключив сделки с Oracle и SoftBank на $500 млрд для проекта Stargate.

Google предоставит доступ к собственным чипам TPU, которые ранее использовались только внутри компании. Это усиливает позиции Google Cloud, конкурирующего с Amazon и Microsoft за клиентов среди ИИ-стартапов. Внутренние проблемы с мощностями у Google и одновременная конкуренция через DeepMind создают сложные задачи для управления ресурсами в новом партнерстве.
reuters.com

✔️ IBM планирует создать первый в мире устойчивый к ошибкам квантовый компьютер к 2029 году.

IBM заявила о планах построить первый в истории крупномасштабный квантовый компьютер Quantum Starling до конца десятилетия. Он будет в 20 тысяч раз мощнее современных квантовых систем, используя новые методы исправления ошибок — коды qLDPC и реальное время коррекции с помощью классических вычислений.

Аналитики осторожны: коммерческая выгода пока неочевидна, а детали запуска систем туманны. Тем не менее, IBM подчеркивает, что ее дорожная карта самая прозрачная в индустрии, призывая разработчиков готовить алгоритмы для будущих машин.
wsj.com

✔️ Марк Цукерберг создает лабораторию для разработки суперинтеллекта.

Цукерберг анонсировал создание новой лаборатории по исследованию «суперинтеллекта» — гипотетической ИИ-системы, превосходящей возможности человеческого мозга. В рамках проекта, она договорилась о сотрудничестве с Алексом Ваном, основателем Scale AI, и планирует инвестировать в его компанию, одновременно переманивая ключевых специалистов.

Источники сообщают, что компания Марка Цукерберга предлагает исследователям из OpenAI, Google и других крупных компаний зарплаты от сотен тысяч до миллионов долларов. Это часть масштабной перестройки ИИ-направления, которое столкнулось с внутренними конфликтами, текучкой кадров и неудачными запусками продуктов.
nytimes.com

✔️ Qualcomm представила чип для AR-очков с локальной обработкой ИИ.

Qualcomm анонсировала процессор Snapdragon AR1+ Gen 1 для умных очков, способный запускать ИИ без подключения к облаку или смартфону. Это позволяет пользователям использовать функции голосового ассистента или отображения текста прямо на стеклах без дополнительных устройств. Чип на 28% компактнее предыдущей версии, что позволяет уменьшить размеры оправы на 20%.

Новинка поддерживает бинокулярное изображение, стабилизацию и обработку нескольких кадров одновременно. Главная фишка - NPU третьего поколения, способный запускать небольшие модели локально.
engadget.com

✔️ Исследование: токсичные данные из 4chan помогают тренировать «устойчивые» ИИ.

Традиционный подход к очистке данных перед обучением LLM оказался не самым эффективным. Ученые выяснили, что добавление небольшого количества провокационного контента из 4chan (до 10%) улучшает «детоксикацию» моделей на поздних этапах. Модель Olmo-1B, обученная на смеси токсичных постов и чистого датасета C4, показала, что ядовитые идеи в модели становятся четче, а значит — их проще подавлять.

Методы вроде коррекции при генерации текста работают точнее, если модель «видела» токсичность заранее. Однако переизбыток 4chan-данных сводит эффект к нулю: модель становится агрессивной и сложной для контроля.

Исследователи предполагают, что аналогичный подход применим к другим «чувствительным» темам — от стереотипов до политики.
arxiv.org

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6926🔥24👀8
🎥 Веса и инференс для SeedVR2 — многообещающей модели для восстановления видео.

🛠️ Что это?
SeedVR2 — одношаговая диффузионная модель для восстановления видео, которая проходит пост-тренировку в противоборстве с реальными данными.

Она показывает отличные результаты даже на высоком разрешении.

🔍 Зачем нужна SeedVR2?
Обычные модели плохо справляются с AIGC и реальными видео — особенно в мелких деталях вроде текста и лиц.
Даже продвинутые диффузионные методы, использующие ControlNet или адаптеры, работают только на фиксированном разрешении (512, 1024) и требуют нарезки видео на перекрывающиеся патчи. Это:
• сильно замедляет работу
• усложняет обработку длинных и больших видео

🚀 Что нового в SeedVR2:
• Восстановление на любом разрешении без заранее обученного диффузионного приоритета
• Архитектура с крупным диффузионным трансформером, обученным с нуля

Github: https://github.com/ByteDance-Seed/SeedVR
x
Веса: https://huggingface.co/ByteDance-Seed/SeedVR-Models

@ai_machinelearning_big_data

#news #ai #ml #ByteDance #video
👍5224🔥18🥰3
🔥 Опубликован 65-й выпуск рейтинга TOP500 — списка самых мощных суперкомпьютеров мира

💡 Тройка лидеров осталась неизменной:

El Capitan (США, Ливерморская нац. лаборатория):
11 млн CPU ядер (AMD EPYC + GPU AMD MI300X),
1.742 экзафлопса, ОС HPE Cray OS (SUSE Linux).

Frontier (США, Ок-Ридж):
9 млн CPU (AMD EPYC + MI250X),
1.353 экзафлопса, ОС HPE Cray OS.

Aurora (США, Аргонн):
9.2 млн CPU (Intel Xeon Max + GPU Max),
1.012 экзафлопса, ОС SUSE Linux Enterprise Server 15 SP4.

🔹 На 4-е место вышел JUPITER Booster (Германия):
4.8 млн ядер (NVIDIA GH200), 793 петафлопса, ОС RHEL.

🔟 **Кластеры 5–10 мест:**
- Eagle (Microsoft Azure, США): 561 петафлопс
- HPC6 (ЭНИ, Италия): 477 петафлопс
- Fugaku (Япония): 442 петафлопса
- Alps (Швейцария): 434 петафлопса
- LUMI (Финляндия): 379 петафлопс
- Leonardo (CINECA, Италия): 241 петафлопс

🇷🇺 Российские суперкомпьютеры:
- Червоненкис (Яндекс): 75 место, 21.5 петафлопса
- Галушкин (Яндекс): 102 место, 16 петафлопс
- Ляпунов (Яндекс): 120 место, 12.8 петафлопса
- Christofari Neo (Сбер): 125 место, 11.95 петафлопса
- Christofari (Сбер): 201 место
- Lomonosov 2: 495 место (в 2015 году был на 31 месте)

🌍 Страны по количеству систем:
- США: 175 кластеров (48.4% производительности)
- Китай: 47 кластеров (2%)
- Германия: 41 (8.6%)
- Япония: 39 (8.9%)
- Франция: 25 (2.4%)
- Италия: 17 (6.3%)
- Россия: 6 (0.1%)

🧠 Тренды:
- Все 500 систем используют Linux.
- Дистрибутивы: неизвестно (38.2%), RHEL (20%), Ubuntu (11.8%), Cray Linux (9.8%), CentOS (8.2%), Rocky (5.8%), SUSE (4.2%), Alma (1.6%)
- Минимальный порог входа в рейтинг: 2.44 петафлопса.
- Общее число процессорных ядер: 137.6 млн.
- С ускорителями работают 234 кластера (в основном NVIDIA A100).

🔧 Лидеры среди производителей:
- Lenovo (27.2%)
- HPE (26.4%)
- EVIDEN (11%)
- Dell EMC (8.2%)
- NVIDIA (5.4%)

🌐 Сети:
- InfiniBand — 54.2% (40.3% производительности)
- Ethernet — 32.8% (52.2%)
- Omni-Path — 6.6%

📊 Также обновлён рейтинг Graph500 (оценка задач с графами)
и интегрированы рейтинги Green500, HPCG и HPL-AI.

🔥 За 10 лет производительность Top500 выросла с 0.31 до 13.8 экзафлопсов. Для входа в Top100 теперь нужно минимум 16.59 петафлопса.

📌 Подробнее

@ai_machinelearning_big_data

#news #ai #ml
64🔥36👍22😢8
Media is too big
VIEW IN TELEGRAM
🔥 Manus Chat Mode — чат с ИИ бесплатно и без ограничений для всех!

💬 Работает супер быстро.

🚀 Так же доступен Agent Mode с расширенными возможностями.

От простых вопросов до сложных задач — всё в одном окне : https://manus.im/

@ai_machinelearning_big_data

#news #ai #ml #manus
👍6021🙈9🔥8🥰4🤬2🌚1
Media is too big
VIEW IN TELEGRAM
✔️ NVIDIA меняет планы разработки новых архитектур: чипы Rubin и процессоры Vera могут появиться уже в сентябре.

Новые графические процессоры серии Rubin R100 и процессоры Vera, вероятно, дебютируют в сентябре. Это стало возможным благодаря ускорению графика разработки — теперь обновления выходят каждые 6 месяцев вместо традиционных 12.

Rubin R100 будет использовать память HBM4, литографию TSMC 3 нм и упаковку CoWoS-L, а также впервые внедрит чиплет-дизайн с 4-кратным увеличением площади кристалла. . Вместе с этим линейка Vera сменит ARM-процессоры Grace и будет основан на новом поколении ядер ARM, обещая значительный прирост производительности. Смена графика разработки несет в себе риски: рынок может не успеть адаптироваться, а первые партии часто сталкиваются с проблемами, как это было с Blackwell.
ctee.com.tw

✔️ Google Cloud представил новые виртуальные машины G4 с GPU NVIDIA Blackwell.

Google Cloud анонсировал превью новых виртуальных машин G4 на базе GPU NVIDIA RTX PRO 6000 Blackwell, став первым публичным облаком, внедрившим эту технологию. Каждый экземпляр объединяет 8 GPU, два процессора AMD Turin с 384 виртуальными ядрами и 1,5 ТБ памяти DDR5, а также сетевые ускорители Titanium с пропускной способностью до 400 Гб/с. Все это дает в 4 раза большую вычислительную мощность и увеличенную в 6 раз пропускную способность памяти по сравнению с предыдущим поколением.

G4 подходит для задач от ИИ-инференса до рендеринга и симуляций с физически точными расчетами. RT-ядра ускоряют трассировку лучей для реалистичной графики, а фреймворк NVIDIA Dynamo оптимизирует обработку генеративных моделей.

Экземпляры будут доступны в составе системы AI Hypercomputer и получат интеграцию с сервисами Google Cloud. Доступность новых VM - ближе к концу года.
cloud.google.com

✔️ Сроки релиза модели с открытыми весами от Open Ai перенесены.

OpenAI откладывает релиз открытой языковой модели до конца этого лета, сообщил генеральный директор Сэм Альтман в X. Первоначально модель планировалось выпустить до конца июня и она, по обещаниям, должна быть с ризонингом.

Альтман сказал, что исследовательская группа достигла неожиданного прогресса, который теперь требует больше времени, назвав результат "стоящим ожидания".
Sam Altman в сети X

✔️ Disney и Universal подали в суд на Midjourney.

Компании подали совместный иск против разработчика ИИ-генератора Midjourney, обвиняя его в нелегальном создании изображений персонажей Дарта Вейдера и Миньонов. Судебный иск был зарегистрирован в федеральном суде Калифорнии, где стороны заявили, что Midjourney продолжал использовать защищенные авторским правом материалы даже после предыдущих требований остановить это.

Студии требуют компенсации убытков, запрета на дальнейшее использование образов и проведения судебного разбирательства с присяжными. Midjourney пока не ответила на запрос публично.
wsj.com

✔️ ChatGPT проиграл в шахматы программе 1977 года.

ChatGPT 4o потерпел неожиданное поражение от шахматной игры 1979 года для консоли Atari 2600 — даже на уровне «начинающий». Инженер Robert Caruso протестировал систему через эмулятор, удивившись, как ChatGPT повторял грубые ошибки: забывал где находятся фигуры и путал их, обвинял слишком абстрактные иконки Atari и пропускал элементарные угрозы.

Программа Atari, работавшая на процессоре 1.19 МГц и анализировавшая лишь 1-2 хода вперед, обыграла нейросеть без шансов на победу. Хотя Роберт менял оформление фигур, пытаясь облегчить задачу, ChatGPT продолжал «тупить», давал обещания выиграть в следующей партии, но в итоге сдался.
tomshardware.com

✔️ V-JEPA 2 — это новая прорывная world model модель для понимания и предсказания визуального мира.

V-JEPA 2 — новая версия модели Joint Embedding Predictive Architecture, обученной на видео.
Она задаёт новый стандарт в визуальном понимании, предсказании и планировании действий в физическом мире.
Github

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥56😁4033👍15🌭2🥰1💘1
2025/07/12 18:08:34
Back to Top
HTML Embed Code: