Machinelearning 7318 - Telegram Web

Machinelearning

🖥

Google анонсировала Ironwood TPU — специализированный чип, созданный для ускоренного инференса ИИ-моделей.

Ironwood — это TPU седьмого поколения, конкурент Blackwell B200 от NVIDIA.

10× прирост производительности по сравнению с предыдущим поколением.

🔧 Что важно знать:
⚡️ Ironwood TPU = высокая плотность + эффективность: на 67% больше FLOPS/ватт, чем v5p и 4 614 TFLOPS на чип (FP8) и 192 ГБ HBM.

Производительность чипов растёт, а энергоэффективность выходит на новый уровень.

🌐 Интеграция с Google Cloud:
Ironwood TPUs уже работают в дата-центрах с жидкостным охлаждением, интегрированы в Vertex AI .

📈 Под капотом — высокоскоростная сеть с пропускной способностью 3.5 Тбит/с, обеспечивающая быструю связность для масштабных моделей.

💡 И да — теперь TPU поддерживают vLLM, а значит, можно легко гонять PyTorch-инференс прямо на TPU, без магии и костылей.

🟡

Подробнее

@ai_machinelearning_big_data

#google #TPU

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍71🔥20❤11🤔6🥰1

18.8K views14:59

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🌟

UNO — новый подход к генерации изображений по нескольким референсам от Bytedance

Новый Flux метод, который позволяет переносить и сохранять объекты с одного или нескольких референс изображений.

UNO способна взять несколько разных объектов или персонажей (их фотографии) и собрать их вместе на одном сгенерированном изображении – все объекты сохраняют свою индивидуальность и детали

Популярные методы генерации в основном заточены под одного героя, но UNO ломает этот барьер, решая сразу две ключевые проблемы: масштабируемость данных и ограниченность одним субъектом

Внутри:
🔁 В UNO внедрён специальный механизм позиционных эмбеддингов – Universal Rotary Position Embedding, или по-другому универсальное позиционное кодирование. Зачем это нужно?
Когда модель работает сразу с несколькими визуальными объектами, есть риск перепутать их свойства или положение (так называемая attribute confusion – «путаница атрибутов»). URPE решает эту проблему: оно помогает модели понимать, где какой объект находится и какие черты ему принадлежат, даже если объектов несколько

Гибкость в разрешениях и форматах. Ещё одна крутая особенность UNO – умение генерировать изображения разного размера и соотношения сторон. Модель обучалась на данных нескольких масштабов, поэтому уверенно чувствует себя и в квадратном формате 512×512, и в нестандартных разрешениях вплоть до 704 пикселей

🔥 Высокая согласованность:
Модель отлично справляется с генерацией персонажей и объектов, сохраняя ключевые особенности сцены — без разрыва между кадрами.

✔️ Проект выложен в open-source:
– Код под Apache 2.0
– Модели под CC BY-NC 4.0
– Поддерживается только некоммерческое использование

🟡

GitHub: https://github.com/bytedance/UNO

🟡

Demo: https://huggingface.co/spaces/bytedance-research/UNO-FLUX

🟡

Paper: https://arxiv.org/abs/2504.02160

🟡

HF: https://huggingface.co/bytedance-research/UNO

#ByteDance #opensource

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍55❤13🔥10🥱1💘1

17.9K viewsedited 17:04

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🖥

Google не на шутку разошлись сегодня!

Они выкатили Firebase Studio - новую облачную агенсткую среду разработки, в которой есть весь инструментарий для быстрого создания полнофункциональных приложений с искусственным интеллектом, и все это в одном месте.

Вы можете создавать приложения на естественном языке, тестить их и развертывать в одном месте 🔥

По сути, это бесплатная альтернатива Cursor, Bolt или v0, прямо в браузере.

https://goo.gle/4cvcUzY

Апдейт: Еще Google дропнули Agent Development Kit (ADK) — новую среду с открытым исходным кодом работы с мульит-агентами!
- открыли доступ к Veo 2 через Gemini API!
- и запускать свой новый MCP протокол Agent2Agent Protocol

@ai_machinelearning_big_data

#GoogleCloudNext #FirebaseStudio

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥121👍56❤17🥰7👀7🥱3🤔2🙊1

33K viewsedited 18:40

Machinelearning

✔️

OpenAI запускает программу разработки специализированных тестов.

OpenAI объявила о старте программы Pioneers Program, которая займётся созданием «доменно-специфичных» бенчмарков для оценки ИИ-моделей. Как отметили в компании, текущие тесты часто не отражают реальных задач — например, фокусируются на решении сложных математических проблем, а не на практическом применении.

В ближайшие месяцы OpenAI планирует сотрудничать со стартапами, которые помогут создать «эталоны качества» для своих сфер. Участники программы также получат доступ к методам тонкой настройки моделей через RL — это повысит эффективность ИИ в узких задачах.
openai.com

✔️

Anthropic запускает подписку Claude Max за $200 в месяц.

Anthropic добавила новый тарифный план Max для Claude. Подписка доступна в 2 вариантах: за $100 в месяц с лимитом в 5 раз выше базового и за $200 — с 20-кратным увеличением. Пользователи получат приоритетный доступ к свежим моделям, включая Claude 3.7 Sonnet.

Параллельно компания развивает нишевые решения, например, Claude для образования, и пытается покрыть растущие затраты на разработку ИИ. Очевидно, гонка за монетизацию «тяжёлых» ИИ-моделей набирает обороты.
techcrunch.com

✔️

WordPress.com запустил свой ИИ-конструктор сайтов.

WordPress.com представил бета-версию ИИ-конструктора, который за минуты создаёт сайты с текстом, изображениями и макетом на основе запросов в чате. Пользователь описывает идею — например, «лендинг для ретро-магазина игр» — а ИИ генерирует контент, подбирает цвета и структуру.

Готовый сайт можно дорабатывать вручную или через чат, но только для новых проектов — миграция существующих пока невозможна. Для интернет-магазинов или сложных интеграций инструмент пока не подходит — разработчики обещают добавить это позже. Чтобы начать, нужен аккаунт WordPress.com: бесплатный пробный период доступен без карты, но для публикации сайта придётся подключить хостинг от $18/месяц.
wordpress.com

✔️

Genomic Tokenizer упрощает анализ ДНК.

В мире геномных исследований появился инструмент, который меняет подход к обработке последовательностей ДНК. Genomic Tokenizer — токенизатор, созданный для анализа генетических данных с учётом биологических принципов. Вместо разбивки на отдельные нуклеотиды он работает с кодонами — трехбуквенными последовательностями, которыми кодируют аминокислоты. Такой подход близок к центральной догме молекулярной биологии и учитывает старт-стоп сигналы, а также синонимичные кодоны.

Интеграция Genomic Tokenizer в экосистему HuggingFace Transformer позволяет обрабатывать даже сдвиги рамок считывания из-за мутаций. Например, при добавлении или удалении нуклеотидов токенизатор сохраняет биологический смысл вариаций, не теряя важных деталей. Все возможные кодоны включены в его словарь, а синонимичные получают одинаковые ID — это ускоряет анализ и снижает нагрузку на модели.
biorxiv.org

✔️

Samsung представит домашнего робота Ballie с Gemini этим летом.

Samsung объявила о старте продаж робота Ballie в США и Южной Корее уже этим летом. В партнёрстве с Google Cloud устройство получит интеграцию с Gemini, которая дополнит собственные разработки Samsung. Ballie умеет обрабатывать голосовые команды, аудио и визуальные данные благодаря мультимодальным алгоритмам. Робот не только управляет умным домом, но и даёт советы по здоровью или стилю.

Цену Ballie Samsung пока не называет, ссылаясь на неопределённость из-за новых таможенных тарифов. Робота впервые показали ещё в 2020-м, а текущая версия с проектором дебютировала на CES 2024.
engadget.com

✔️

Выпущен API Grok 3

grok-3-beta: $3 за ввод / $15 за вывод
grok-3-fast: $5 за ввод / $25 за вывод
grok-3-mini: $0.30 за ввод / $0.50 за вывод
grok-3-mini-fast: $0.60 за ввод / $4 за вывод

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥37👍29❤12🤬4

17.1K viewsedited 06:05

Machinelearning

📌

SAE Match: новый метод в области интерпретируемости ИИ

Предыдущие разработки в области интерпретируемости не позволяли понять, как большие языковые модели обрабатывают информацию на каждом этапе вычислений и как эволюционируют концепции от слоя к слою.

Для решения этой проблемы ученые из T-Bank AI Research разработали метод, который позволяет выявить моменты, когда ИИ начинает предсказывать нежелательные или ошибочные ответы, и оперативно их исправить. Это, наверное, первый шаг на пути к более прозрачным, точным и понятным алгоритмам — особенно важно при внедрении ИИ в критически важные сферы, такие как медицина, финансы и безопасность. При этом дополнительные данные и переобучение модели не потребуются. В будущем метод может применяться в разработке гибридных структур ИИ в качестве фундамента для дальнейшего развития интерпретируемых моделей.

Результаты работы будут представлены на одной из главных конференций в области машинного обучения и искусственного интеллекта уровня А* — международной конференции по обучению представлениям (ICRL), которая в этом году пройдет в Сингапуре с 24 по 28 апреля.

🔗Новость

@ai_machinelearning_big_data

#AI #ML #LLM #news

Please open Telegram to view this post

VIEW IN TELEGRAM

👍59❤20🔥14🤣8

16K views08:14

Machinelearning

🌟

Kimi-VL: VLM с MoE, ризонингом и контекстом 128K.

Moonshot AI опубликовала веса Kimi-VL — открытой VLM, которая объединяет обработку текста, изображений и видео. Благодаря архитектуре MoE модель активирует всего 2.8 млрд. параметров в языковом декодере, обеспечивая скорость, сопоставимую с компактными аналогами, и результативность флагманских решений.

Главное преимущество Kimi-VL — способность анализировать длинные контексты до 128 тыс. токенов, что делает её идеальной для работы с объемными документами, длинными видео или сложными мультимедийными задачами.

Основу модели составляет визуальный энкодер MoonViT, оптимизированный для нативной обработки изображений любого разрешения без необходимости разбивать их на части. Это позволяет точно распознавать текст, графики или UI-интерфейсы даже в высокодетализированных скриншотах.

Например, на бенчмарке InfoVQA модель показывает точность 83.2%, обходя даже GPT-4o. В задачах OCR Kimi-VL достигает 86.7% на OCRBench, что ставит её в ряд лучших в индустрии.

Разработчики также представили Kimi-VL-Thinking — версию с расширенными возможностями CoT. Благодаря использованным RL и длительному CoT-тюнингу она демонстрирует впечатляющие результаты в математических и академических задачах: на MathVista точность составила 71.3%, а на MMMU — до 61.7%, что лучше, чем у Gemma-3-12B-IT.

В тестах Kimi-VL превосходит конкурентов в работе с агентами: на OSWorld её результат 8.22% выше, чем у GPT-4o (5.03%), а на WindowsAgentArena — 10.4%. Для длинных видео модель набирает 64.5% на LongVideoBench, подтверждая способность анализировать часовые записи без потери ключевых деталей.

Модели доступны на Hugging Face в двух вариантах:

🟢

Kimi-VL-A3B-Instruct для стандартных задач;

🟠

Kimi-VL-Thinking для сложных рассуждений.

▶️ Инференс через Transformers занимает несколько строк кода — достаточно загрузить изображение, задать запрос и получить подробный ответ.

📌Лицензирование: MIT License.

🟡

Набор моделей

🟡

Техотчет

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #VLM #KimiAI #MoonShotAI

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍65❤17🔥12🤔1

24.4K views09:55

Machinelearning

🌟

Google Cloud запускает ИИ-решения и суперкомпьютеры для науки.

Ученые все чаще переходят на облачные технологии, чтобы решать сложнейшие задачи — от прогнозирования погоды до симуляции квантовых систем. Google Cloud сделала новый шаг им навстречу, представив супервычислительные решения, ИИ-модели и сервисы, которые помогут делать открытия быстрее:

🟢Основой для многих проектов станут новые виртуальные машины H4D — самые мощные CPU-решения Google Cloud. Они построены на CPU AMD и используют сетевую технологию Titanium для ускорения передачи данных.

🟢Чтобы упростить работу с кластерами, Google обновил Cluster Toolkit и Cluster Director: теперь развертывание крупных систем стало проще, а управление — эффективнее.

🟢Новая версия AlphaFold 3 High-Throughput Solution доступна для некоммерческого использования и умеет обрабатывать тысячи последовательностей, автоматически масштабируя ресурсы.

🟢

WeatherNext предлагает быстрые и точные прогнозы погоды через платформу Vertex AI Model Garden. Ученые смогут тестировать больше сценариев, а компании — лучше готовиться к стихийным событиям.

Google также добавил в Agentspace двух ИИ-агентов. Первый, Deep Research, за минуты анализирует горы данных и генерирует детальные отчёты. Второй, Idea Generation, помогает учёным быстро придумывать гипотезы для экспериментов. Оба инструмента уже доступны в тестовом режиме.

Не забыли и о хранении данных: новая управляемая файловая система Lustre, созданная с DDN, справится с нагрузками даже самых требовательных проектов. А для тех, кто только начинает, Google Cloud предлагает гранты, обучение и доступ к сообществу Advanced Computing Community.

Эти обновления — не просто апдейты. Они меняют правила игры, объединяя вычислительную мощь, ИИ и удобство облака.

🔜

Читать подробный анонс

@ai_machinelearning_big_data

#google

Please open Telegram to view this post

VIEW IN TELEGRAM

👍51🔥20❤13🤬4🥱1

15.5K viewsedited 15:20

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🖥

Начиная с сегодняшнего дня, память в ChatGPT стала более продвинутой — теперь ИИ может учитывать все прошлые чаты, чтобы давать более персонализированные ответы.

• Помнит все интересы и стиль общения пользователя
• Подстраивается под цели: учёба, код, тексты, советы
• Работает незаметно, но помогает как будто «знает пользователя давно»

Например:
• Если раньше вы часто спрашивали про японский язык — ChatGPT может сам использовать это в будущих ответах.
• Если вы писали статьи — он подстроит стиль под вас.

Это новый уровень взаимодействия с ИИ — теперь он не просто отвечает, а действительно работает как личный ассистент.

Таким образом, ИИ сможет оказывать контекстную и индивидуальную поддержку, будь то в области здравоохранения, зная историю болезни пользователя (которую не нужно постоянно повторять), или в личной сфере, понимая текущие жизненные ситуации (траур, радость и т. д.).

Улучшенная память в ChatGPT доступна с сегодняшнего дня всем пользователям Plus и Pro, за исключением стран EEA, Великобритании, Швейцарии, Норвегии, Исландии и Лихтенштейна.

Пользователи Team, Enterprise и Edu получат доступ через несколько недель.

🔐 Контроль за памятью — полностью у пользователя

- Вы можете отключить использование памяти в любое время в настройках.

- Если память у вас уже отключена — ИИ не будет использовать старые чаты.

- Хотите изменить то, что он о вас помнит? Просто напишите об этом в чат.

- Хотите поговорить без памяти? Используйте временный чат (temporary chat)👌

https://x.com/OpenAI/status/1910378768172212636

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍77🔥32❤21🤷‍♀8👏4💯2⚡1🥰1😐1

26K viewsedited 17:15

Machinelearning

🖥 Вдогонку OpenAI выпустили BrowseComp — новый бенчмарк, предназначенный для оценки способности AI-агентов находить сложную и труднодоступную информацию в интернете.

Этот набор данных включает 1 266 задач, требующих от моделей глубокого понимания контекста и эффективного поиска информации.

Особенности:

▪ В отличие от существующих бенчмарков, таких как SimpleQA, BrowseComp фокусируется на вопросах, ответы на которые трудно найти и которые требуют анализа множества источников.
Например, “Найдите мне статью из EMNLP 2018–2023, где первый автор учился в бакалавриате в Dartmouth, а четвёртый — в UPenn”
→ Ответ: Frequency Effects on Syntactic Rule Learning in Transformers

▪ Структура вопросов: Каждый вопрос имеет однозначный, короткий ответ, что облегчает оценку результатов и снижает вероятность неоднозначности.
OpenAI

▪ Примеры вопросов: Вопросы охватывают различные темы и требуют от модели способности устанавливать связи между разрозненными фактами.
OpenAI

💡 По аналогии с тем, как CodeForces навыки программирования, BrowseComp показывает, насколько модель способна ориентироваться в "диких" условиях в вебе.

🟡

🟡

Paper

@ai_machinelearning_big_data

#openai #benchmark

Please open Telegram to view this post

VIEW IN TELEGRAM

👍76🔥26❤8😁5

18.8K viewsedited 18:54

Machinelearning

✔️

Forbes опубликовал список 2025 AI 50.

Forbes выпустил ежегодный рейтинг AI 50, составленный в сотрудничестве с Sequoia и Meritech Capital, который показал смещение акцента среди ИИ-стартапов с разработки моделей на создание практических приложений. Новички списка:, Anysphere (Cursor) и Speak (обучение английскому и испанскому с аудиторией 10 млн пользователей).

Лидеры прежние: OpenAI и Anthropic. Впервые в список попали xAI и проект Миры Мурати Thinking Maсhine. В этом году было подано 1860 заявок, а суммарное финансирование участников составило 142,45 млрд. долл.
forbes.com

✔️

Google и Samsung показали прототипы устройств Android XR.

На TED2025 в Ванкувере глава подразделения Android X продемонстрировал прототип умных очков от Google. Устройство получило функции перевода в реальном времени, распознавание изображений и интеграцию с Gemini.

Параллельно Samsung представила свой X-rеality шлем с акцентом на многозадачность. Оба проекта развиваются в рамках Android XR, но детали их релиза и даты выхода остаются неизвестными.
9to5google.com

✔️

QodoAI внедрила RAG в код-ревью инструмент Qodo Merge.

QodoAI выпустила обновление для своего инструмента проверки кода Qodo Merge, интегрировав технологию RAG. Это позволит разработчикам анализировать код в контексте всей базы проекта, ускоряя ревью и упрощая коммуникацию по правкам.

RAG даёт ИИ доступ к полной истории и зависимостям кода - теперь система может автоматически предлагать исправления, ссылаясь на ранее написанные модули.
bito.ai

✔️

Adobe анонсировала ИИ-агентов для Photoshop, Acrobat и Premiere Pro.

Adobe анонсировала разработку ИИ-агентов для Photoshop и Premiere Pro, которые упростят рутинные задачи в редакторах. Например, ИИ может автоматически убрать людей с фона или настроить глубину резкости — пользователю достаточно кликнуть по подсказке.

Для Premiere Pro агенты помогут создавать черновые монтажи, корректировать цвет и звук, опираясь на функцию Media Intelligence, которая распознаёт объекты в видео. При этом ИИ не заменяет креативность, а ускоряет работу: система обучаема, а пользователи смогут давать команды на естественном языке.

Презентация технологии для Photoshop состоится 24 апреля на мероприятии Max в Лондоне.
blog.adobe.com

✔️

Спам-бот при помощи ChatGPT атаковал 80 000 сайтов.

SentinelLabs обнаружили, что спамеры используют модели OpenAI для массовой рассылки сообщений, обходящих стандартные фильтры. Бот AkiraBot генерировал уникальный контент через API ChatGPT (модель gpt-4o-mini), подставляя в шаблон название целевого сайта. Это делало каждое сообщение «персонализированным», усложняя его блокировку.

Вместо шаблонных фраз AkiraBot создавал описания услуг под конкретный ресурс, имитируя ручную работу. По данным логов, с сентября 2024 по январь 2025 года бот успешно отправил сообщения на 80 000 доменов, тогда как 11 000 попыток завершились ошибкой.

OpenAI подтвердила, что подобное использование ChatGPT нарушает её политику, и поблагодарила экспертов за информацию.
arstechnica.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥43👍33❤15🥰4🤝1

16K views08:01

Machinelearning

✔️

Google представила новые геопространственные модели для анализа данных.

Google анонсировала запуск тестовой программы новых геопространственных и Population Dynamics моделей.

Эти инструменты объединяют генеративный ИИ (под капотом - Gemini), с данными спутниковых снимков и социальными индексами, чтобы ускорить анализ в сферах урбанистики, экологии и кризисного управления.

Модели позволяют находить объекты по описанию («дороги с заторами»), сегментировать ландшафты и предсказывать динамику населения. Интеграция с Google Cloud и Earth Engine дает разработчикам возможность для создания собственных решений — от медиапланирования до мониторинга сельхозугодий.

Первыми тестерами стали Airbus, Maxar и Planet Labs: они используют модели для анализа спутниковых данных в реальном времени. Сейчас доступ к моделям открыт через программу Trusted Tester, а детали Google обещает раскрыть в ближайшие месяцы.

🔗 research.google

@ai_machinelearning_big_data

#google #geospatialreasoning

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍48❤15🔥14

20.6K views12:01

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

✔️

Google Veo-2 стал доступен в AI Studio бесплатным пользователям

Можно создавать 5, 6, 7 и 8 секундные видеоролики.

Генерация 6-секундного заняла примерно 45 секунд.

Примечание: доступ пока открыт появился не у всех (у меня появился на бесплатном акке), ждем анонса от Google

https://aistudio.google.com/

Напишите в комментах появился ли Veo у вас?

@ai_machinelearning_big_data

#video #veo2

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍69❤18🔥13🥰2

15.6K viewsedited 13:19

2025/07/13 03:51:44
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>