Вслед за релизом Hunyuan Portrait, Tencent выпустила Hunyuan Video Avatar - систему на базе MM-DiT для генерации динамичных видео из изображения с одним или несколькими персонажами, синхронизированных с аудио.
Объединить такие возможности было непростой задачей, это стало возможным благодаря использованию ключевых для Hunyuan Video Avatar методов:
По сравнительных тестах с Sonic, EchoMimic, EchoMimicV2 и Hallo-3 на датасетах для портретной анимации (HDTF, CelebV-HQ и свой приватный сет) Hunyuan Video Avatar показал лучшие результаты: 3,99 в метриках качества видео (IQA), 2,54 по эстетике (ASE), 5,30 в синхронизации аудио и видео (Sync-C), 38.01 в точности воспроизведения видео (FID) и 358.71 по искажениям (FVD).
При тестировании полнокадровой анимации на собственном датасете HunyuanVideo-Avatar показал лучшие результаты по IQA (4.66), ASE (3.03) и Sync-C (5.56) в сравнении с Hallo3, FantasyTalking и OmniHuman-1.
⚠️ Модель прожорливая: минимум 24 ГБ VRAM для 704x768, а для плавного 4K рекомендуют GPU на 96 ГБ.
Зато входные изображения берет любые: фотореалистичные портреты, 3D-модели, аниме-персонажи — хоть лису в костюме. Разрешение тоже гибкое: от крупных планов до полноростовых.
@ai_machinelearning_big_data
#AI #ML #HunyuanAvatar
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍57❤26🔥13👏4🤣2👌1🎄1
Исследователи Яндекса выложили в опенсорс датасет для RecSys почти на 5 млрд событий — YaMBDa
YaMBDa содержит 4,79 млрд событий – обезличенных взаимодействий пользователей в Яндекс Музыке и «Моей Волне». К ним относятся прослушивания, лайки/дизлайки, временные метки и некоторые характеристики треков. Важно, что все данные анонимизированы, датасет включает в себя только числовые идентификаторы. При этом датасет предназначен для тестирования алгоритмов для разных областей, а не только для стримингов.
Алгоритмы рекомендаций какое-то время оставались на плато, в том числе из-за ограниченного доступа к большим, реалистичным датасетам. Даже с появлением LLM и ускорением обучения иногда может все еще не хватать качественных публичных данных, особенно приближенных к продакшн-нагрузкам. Известные LFM-1B, LFM-2B и Music Listening Histories Dataset (27B) со временем стали недоступны из-за лицензионных ограничений. А рекорд по числу взаимодействий сейчас держит рекламный датасет от Criteo — около 4 млрд событий.
⚙️ Что внутри YaMBDa:
– 3 объёма данных: 50M, 500M и полный сет на 4,79B событий
– Эмбеддинги треков из аудио, полученные через CNN
– Метка
– Формат Parquet с поддержкой Pandas, Polars (альтернатива Pandas) и Spark
🔗Доступно на HuggingFace
@ai_machinelearning_big_data
#dataset
YaMBDa содержит 4,79 млрд событий – обезличенных взаимодействий пользователей в Яндекс Музыке и «Моей Волне». К ним относятся прослушивания, лайки/дизлайки, временные метки и некоторые характеристики треков. Важно, что все данные анонимизированы, датасет включает в себя только числовые идентификаторы. При этом датасет предназначен для тестирования алгоритмов для разных областей, а не только для стримингов.
Алгоритмы рекомендаций какое-то время оставались на плато, в том числе из-за ограниченного доступа к большим, реалистичным датасетам. Даже с появлением LLM и ускорением обучения иногда может все еще не хватать качественных публичных данных, особенно приближенных к продакшн-нагрузкам. Известные LFM-1B, LFM-2B и Music Listening Histories Dataset (27B) со временем стали недоступны из-за лицензионных ограничений. А рекорд по числу взаимодействий сейчас держит рекламный датасет от Criteo — около 4 млрд событий.
⚙️ Что внутри YaMBDa:
– 3 объёма данных: 50M, 500M и полный сет на 4,79B событий
– Эмбеддинги треков из аудио, полученные через CNN
– Метка
is_organic
: отличает органические действия в датасете от рекомендованных– Формат Parquet с поддержкой Pandas, Polars (альтернатива Pandas) и Spark
🔗Доступно на HuggingFace
@ai_machinelearning_big_data
#dataset
👍88🔥26❤21🤬5🤣4🤔3🎄1
This media is not supported in your browser
VIEW IN TELEGRAM
Один из топ-CEO компаний, работающих с искусственным интеллектом, публично заявляет:
> «Всё под контролем. Нам нечего бояться».
Но в приватной беседе — совсем другое:
> «Нас ожидает нечто по-настоящему ужасающее».
> «То, что он говорит мне наедине — полностью противоположно публичным заявлениям», — добавил источник.
📉 Выходит, даже те, кто стоит у руля ИИ-революции, не до конца уверены, чем она обернётся.
❓А если они боятся — стоит ли нам просто наблюдать?
👉 Полное видео
@ai_machinelearning_big_data
#AI #Ethics #ИИ #Будущее
Please open Telegram to view this post
VIEW IN TELEGRAM
11🤣71👍34❤14🔥12🤔8🥱4🤷♂2🤷2🥰1😴1
This media is not supported in your browser
VIEW IN TELEGRAM
🌀 Opera Neon — браузер-агент нового поколения
Opera представила Neon — браузер со встроенным ИИ-агентом, который продолжает выполнять задачи даже тогда, когда пользователь спит.
🌐 Что умеет Opera Neon?
🔹 Понимает намерения пользователя
🔹 Помогает с задачами — от поиска до бронирования
🔹 Самостоятельно действует: анализирует, предлагает и выполняет
🔹 Работает как агент, а не просто интерфейс
Это инфраструктура для агентного интернета, где ИИ помогает тебе в реальном времени.
🚀 Доступ только по инвайтам. Сейчас Opera открывает доступ первым участникам сообщества, чтобы сформировать будущее вместе.
Подать заявку: https://www.operaneon.com/
@ai_machinelearning_big_data
#OperaNeon #AgenticWeb #AI #БраузерБудущего
Opera представила Neon — браузер со встроенным ИИ-агентом, который продолжает выполнять задачи даже тогда, когда пользователь спит.
🌐 Что умеет Opera Neon?
🔹 Понимает намерения пользователя
🔹 Помогает с задачами — от поиска до бронирования
🔹 Самостоятельно действует: анализирует, предлагает и выполняет
🔹 Работает как агент, а не просто интерфейс
Это инфраструктура для агентного интернета, где ИИ помогает тебе в реальном времени.
🚀 Доступ только по инвайтам. Сейчас Opera открывает доступ первым участникам сообщества, чтобы сформировать будущее вместе.
Подать заявку: https://www.operaneon.com/
@ai_machinelearning_big_data
#OperaNeon #AgenticWeb #AI #БраузерБудущего
🔥47👍21❤15😁12🎄1
Media is too big
VIEW IN TELEGRAM
🤖 Boston Dynamics показали, как их гуманоидный робот Atlas «видит» мир и взаимодействует с ним
В новом видео команда ИИ-инженеров показала, как устроена система восприятия Atlas — и это уже не просто «робот с камерами», а почти полноценный агент с чувством пространства и контекста.
🧠 Что умеет Atlas:
🔹 Понимает форму и назначение объектов в реальной среде
🔹 Объединяет 2D и 3D восприятие
🔹 Использует ключевые точки для ориентации в пространстве
🔹 Отслеживает позы объектов с учётом их движения и перекрытия
🔹 Сливает визуальные данные, кинематику и знания об объектах в одну систему
🔹 Имеет сверхточную калибровку для координации «глаз–рука»
Atlas может не просто находить предмет, но понимать, *что это*, *зачем оно нужно* и *как его лучше схватить*, даже если оно наполовину скрыто.
Команда инженеров работает над единой моделью, которая объединяет восприятие и управление. Это шаг от просто «пространственного ИИ» к настоящему физическому интеллекту.
Их робот выглядит на данный момент самым передовым, как вы считаете?
@ai_machinelearning_big_data
#Atlas #BostonDynamics #AI #Robotics #Перцепция #ИскусственныйИнтеллект
В новом видео команда ИИ-инженеров показала, как устроена система восприятия Atlas — и это уже не просто «робот с камерами», а почти полноценный агент с чувством пространства и контекста.
🧠 Что умеет Atlas:
🔹 Понимает форму и назначение объектов в реальной среде
🔹 Объединяет 2D и 3D восприятие
🔹 Использует ключевые точки для ориентации в пространстве
🔹 Отслеживает позы объектов с учётом их движения и перекрытия
🔹 Сливает визуальные данные, кинематику и знания об объектах в одну систему
🔹 Имеет сверхточную калибровку для координации «глаз–рука»
Atlas может не просто находить предмет, но понимать, *что это*, *зачем оно нужно* и *как его лучше схватить*, даже если оно наполовину скрыто.
Команда инженеров работает над единой моделью, которая объединяет восприятие и управление. Это шаг от просто «пространственного ИИ» к настоящему физическому интеллекту.
Их робот выглядит на данный момент самым передовым, как вы считаете?
@ai_machinelearning_big_data
#Atlas #BostonDynamics #AI #Robotics #Перцепция #ИскусственныйИнтеллект
🔥88👍36❤18🤔9🎄1
Media is too big
VIEW IN TELEGRAM
По словам Павла Дурова, его платформа и компания Илона Маска xAI заключили годовое соглашение. xAI заплатит Telegram $300 млн. за интеграцию чат-бота Grok прямо в мессенджер. Помимо этого, Telegram также будет получать 50% от выручки с подписок на Grok, которые будут продаваться внутри платформы.
Илон Маск позже написал в X: "Контракт еще не подписан". Однако он не стал уточнять детали, оставив вопрос открытым. Пока что официальная позиция Telegram – сделка есть, и она принесет пользователям лучший ИИ на рынке уже этим летом.
Новость пришла на фоне важных для Telegram событий: сервис преодолел отметку в 1 млрд. активных пользователей в месяц в этом году и разместил облигации на $1.5 млрд.
Pavel Durov
Anthropic сняла ограничения с функции веб-поиска в Claude: теперь даже бесплатные пользователи смогут получать ответы на основе актуальных данных из интернета. Ранее, доступ к этой опции, которая анализирует информацию в реальном времени, был эксклюзивом для платных подписчиков. Это изменение позволит чаще обновлять знания модели и точнее решать задачи.
Параллельно стартовало тестирование голосового режима в мобильном приложении. Пользователи могут общаться с Claude в формате диалога, выбирая из 5 вариантов голоса и получать краткие текстовые сводки прошлых бесед. По умолчанию для диалогов задействована модель Sonnet 4.
support.anthropic
OpenAI активно прорабатывает функцию "Вход через ChatGPT", позволяющую пользователям авторизовываться в сторонних приложениях через свои аккаунты ChatGPT. Компания уже собирает заявки от разработчиков, желающих интегрировать эту опцию в свои сервисы. Пилотный запуск для тестирования уже доступен в Codex CLI — инструменте для работы с ИИ в терминале. Разработчики могут подключить ChatGPT Free, Plus или Pro к своим API-аккаунтам, получая бонусные кредиты ($5 для Plus и $50 для Pro).
Это стратегический ход для расширения экосистемы. С 600 млн активных пользователей ежемесячно, "Вход через ChatGPT" может стать ключевым элементом, помогая OpenAI конкурировать с Google и Apple в сфере единого входа и онлайн-сервисов. Точные сроки публичного релиза пока неизвестны.
techcrunch
К своему юбилею Google Photos получает мощное обновление, сфокусированное на ИИ-редактировании. Сервис, где ежемесячно редактируют 210 млн. снимков, теперь предлагает умные подсказки по улучшению кадра одним нажатием. Можно тыкнуть пальцем или обвести область — нейросеть предложит подходящий инструмент. Главные новинки — "Reimagine" и "Auto Frame", ранее доступные только на Pixel 9.
"Reimagine" меняет выбранный объект или добавляет новый по текстовому запросу через генеративный ИИ. "Auto Frame" автоматически кадрирует фото, а нейросеть дорисовывает фон. Плюс Google добавит QR-коды для альбомов, чтобы удобно собирать фото с мероприятий. Правда, обновленный редактор появится на Android в июне, а владельцам iPhone ждать до конца года.
arstechnica
С 28 мая стартовал прием заявок на ежегодную премию Yandex ML Prize 2025. Эта награда — реальное признание и поддержка для тех, кто растит новые кадры ML в России. Премия существует с 2019 года как память об Илье Сегаловиче, и за шесть лет её получили уже 60 выдающихся педагогов и руководителей.
Податься могут вузовские преподаватели, ученые из исследовательских центров и руководители образовательных программ в области Сomputer Science. Победителей ждут денежные призы и полезные гранты на Yandex Cloud, которые точно пригодится в работе: делать новые курсы, организовывать хакатоны и проводить исследования вместе со студентами.
Заявки принимают до 22 июня. Само награждение, как обычно, пройдет осенью.
habr.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤47🔥23👍20👌2🎄2
Главное:
• Глубокое рассуждение — на уровне моделей Google
• Улучшена генерация текста — более естественно, структурировано и аккуратно
• Уникальный стиль reasoning — не просто быстро, а вдумчиво и последовательно
• Может работать над одной задачей 30–60 минут, удерживая контекст
Новая модель показывает результат почти на уровне o3 (High) на бенчмарк LiveCodeBench.
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
@ai_machinelearning_big_data
#DeepSeek #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
👍101🔥35❤24😁9🥱5❤🔥4🙈1🎄1
📈 За квартал общая выручка выросла на 69%, а продажи в дата-центрах (включая AI-чипы и инфраструктуру) — на 73%.
🔥 Главная причина? Очевидна: взрывной спрос на GPU для обучения и инференса ИИ.
Мир строит LLM — и делает это на железе NVIDIA.
▪ Выручка: $44.1 млрд (+69% год к году)
▪ Earnings per share: $0.96 (прогноз был $0.93)
▪ Доход от дата-центров: $39 млрд (+73% YoY)
▪ Доход от гейминга: $3.8 млрд (+48% по сравнению с прошлым кварталом)
Фактический показатель прибыли на акцию (EPS) у NVIDIA составил $0.96, что на 3,23% выше прогнозируемых $0.93.
Также выручка превысила ожидания на $800 млн, что подчёркивает способность компании точно попадать в рыночные тренды и сохранять уверенное финансовое здоровье.
🔥 Комментарии излишни — рынок ИИ буквально катапультирует NVIDIA на новый уровень. GPU стали не просто новым золотом, а инфраструктурой будущего.
Пока другие корпорации режут бюджеты и занижают прогнозы, NVIDIA штампует рекорды — квартал за кварталом.
@ai_machinelearning_big_data
#NVIDIA
Please open Telegram to view this post
VIEW IN TELEGRAM
❤66👍35🔥15👻6🤔3🤬3🎄1
Forwarded from Анализ данных (Data analysis)
🚀 Представлен Apache Spark 4.0 — крупнейший релиз с момента запуска Spark 2.0
Databricks анонсировали Spark 4.0 с множеством фундаментальных улучшений производительности и архитектуры.
Новый релиз фокусируется на ускорении обработки, поддержке GenAI-нагрузок и расширенной масштабируемости.
🔥 Что нового:
• 💡 Project Tungsten++, Catalyst++ — переработка движка исполнения и оптимизации запросов
• 🧠 Поддержка генеративных AI-запросов — Spark теперь эффективнее работает с LLM-нагрузками
• ⚙️ Новый Execution Engine — более 2× ускорение в среднем, до 10× в некоторых кейсах
• 📦 Модульная архитектура — теперь ядро Spark отделено от MLlib, GraphX и др.
• 🌐 Поддержка нового Shuffle-движка и улучшенное распределение по кластерам
• 🧪 Обратная несовместимость — Spark 4.0 требует миграции, особенно для UDF и кастомных оптимизаций
📌 Подробности и тесты:
https://www.databricks.com/blog/introducing-apache-spark-40
@data_analysis_ml
Databricks анонсировали Spark 4.0 с множеством фундаментальных улучшений производительности и архитектуры.
Новый релиз фокусируется на ускорении обработки, поддержке GenAI-нагрузок и расширенной масштабируемости.
🔥 Что нового:
• 💡 Project Tungsten++, Catalyst++ — переработка движка исполнения и оптимизации запросов
• 🧠 Поддержка генеративных AI-запросов — Spark теперь эффективнее работает с LLM-нагрузками
• ⚙️ Новый Execution Engine — более 2× ускорение в среднем, до 10× в некоторых кейсах
• 📦 Модульная архитектура — теперь ядро Spark отделено от MLlib, GraphX и др.
• 🌐 Поддержка нового Shuffle-движка и улучшенное распределение по кластерам
• 🧪 Обратная несовместимость — Spark 4.0 требует миграции, особенно для UDF и кастомных оптимизаций
📌 Подробности и тесты:
https://www.databricks.com/blog/introducing-apache-spark-40
@data_analysis_ml
❤41👍22🔥13😁2
🤖 Нейросети Яндекса ускорили запуск клинических исследований в десятки раз
НМИЦ онкологии им. Н.Н. Петрова внедрил RAG-пайплайн на базе YandexGPT для автоматической обработки документов клинических исследований.
Система анализирует сотни страниц за минуты вместо недель, что радикально ускоряет запуск новых методов лечения.
⚙️ Техническая реализация:
• Облачная архитектура на Yandex Cloud (Compute Cloud + Kubernetes)
• RAG-подход для обработки документов объёмом до 1.5M токенов
• Чанкирование и классификация документов по 10 типам
• Автоматическая OCR-обработка таблиц через docling
• Хранение данных в PostgreSQL с планами миграции на Serverless
• Streamlit для веб-интерфейса и автоматизация через Yandex Tracker
🧠 ML-стек:
• Ядро системы — YandexGPT 5 Pro (после тестирования и сравнения с Llama 3.2 70b)
• Специализированные промпты в виде чек-листов для каждого типа документа
• Настройка модели для работы с медицинской терминологией
• В перспективе — интеграция VLM для обработки графиков и схем
💡 Результаты внедрения:
Система может обрабатывать пакеты до 2000 страниц, справляясь с неструктурированными данными, сканами документов и сложными таблицами. В 95% случаев первичная проверка выполняется без участия человека.
Решение уже применяется в локальном этическом комитете НМИЦ, который обрабатывает около 1000 обращений в год. В перспективе технология будет внедрена в онкологических центрах стран BRICS и других учреждениях, проводящих клинические исследования.
🟡 Статья
@ai_machinelearning_big_data
НМИЦ онкологии им. Н.Н. Петрова внедрил RAG-пайплайн на базе YandexGPT для автоматической обработки документов клинических исследований.
Система анализирует сотни страниц за минуты вместо недель, что радикально ускоряет запуск новых методов лечения.
⚙️ Техническая реализация:
• Облачная архитектура на Yandex Cloud (Compute Cloud + Kubernetes)
• RAG-подход для обработки документов объёмом до 1.5M токенов
• Чанкирование и классификация документов по 10 типам
• Автоматическая OCR-обработка таблиц через docling
• Хранение данных в PostgreSQL с планами миграции на Serverless
• Streamlit для веб-интерфейса и автоматизация через Yandex Tracker
🧠 ML-стек:
• Ядро системы — YandexGPT 5 Pro (после тестирования и сравнения с Llama 3.2 70b)
• Специализированные промпты в виде чек-листов для каждого типа документа
• Настройка модели для работы с медицинской терминологией
• В перспективе — интеграция VLM для обработки графиков и схем
💡 Результаты внедрения:
«С нейросетью YandexGPT на проверку документов теперь нужны минуты вместо недель. Полный цикл согласования можно сократить с нескольких месяцев до 5–10 рабочих дней», — комментирует Артём Полторацкий, руководитель отдела доклинических и клинических исследований НМИЦ онкологии им. Н.Н. Петрова.
Система может обрабатывать пакеты до 2000 страниц, справляясь с неструктурированными данными, сканами документов и сложными таблицами. В 95% случаев первичная проверка выполняется без участия человека.
Решение уже применяется в локальном этическом комитете НМИЦ, который обрабатывает около 1000 обращений в год. В перспективе технология будет внедрена в онкологических центрах стран BRICS и других учреждениях, проводящих клинические исследования.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥132👍38❤23🤨14😁4🐳4🎄2🥰1
Media is too big
VIEW IN TELEGRAM
Mistral AI представила Codestral Embed — свою первую модель для создания эмбеддингов кода, которая уже обходит ключевых конкурентов: Voyage Code 3, Cohere Embed v4.0 и крупные эмбеддинги от OpenAI.
Codestral Embed заточена под реальные задачи: поиск релевантного кода по описанию, RAG для код-ассистентов, обнаружение дубликатов и семантическую кластеризацию.
Модель доступна через API ($0.15 за миллион токенов) или со скидкой 50% в пакетном режиме доступа. Для локальных развертываний необходимо связаться с Mistral. Документация - на сайте, есть cookbook на Google Collab.
mistral.ai
Anthropic выложила в открытый доступ свой метод интерпретируемости, позволяющий заглянуть внутрь работы языковых моделей. Речь о генерации графов атрибуции — визуальных схем, которые частично показывают, какие шаги модель делает "в уме", формируя ответ.
Это не просто картинки - инструменты помогают исследователям тестировать гипотезы, модифицируя признаки и наблюдая за изменениями в выводе модели. Можно визуализировать, аннотировать найденные "цепочки", например, отвечающих за многошаговые рассуждения. Попробовать можно уже сейчас на Neuronpedia, код доступен в репозитории проекта.
anthropic.com
Perplexity запускает новый инструмент – Perplexity Labs. Это не просто поиск ответов или их углубленный анализ, а целая команда в вашем браузере.
Система использует самообучающиеся процессы, глубокий веб-поиск, исполнение кода и генерацию контента. Labs может создавать отчеты, дашборды, электронные таблицы, визуализации данных и даже простые веб-приложения прямо во вкладке "App". Весь сгенерированный код, файлы, графики и изображения собираются во вкладке "Assets" для скачивания.
Labs доступен для подписчиков Pro на сайте и в iOS-приложении.
perplexity.ai
FLUX.1 Kontext — семейство моделей для генерации и редактирования изображений, которые работают "в контексте". Это значит, что модели умеют не только генерировать картинки по тексту, но и принимать на вход изображения, чтобы модель поняла, что именно вы хотите сохранить или изменить. Возможности: сохранение стиля или персонажа из вашего референса, точечное редактирование без искажения и добавление инструкций шаг за шагом.
Есть 3 версии: FLUX.1 Kontext [pro] — универсальная для генерации и инпейнта, работает в разы быстрее аналогов и сохраняет консистентность при многошаговых правках. FLUX.1 Kontext [max] — экспериментальная модель с улучшенным следованием промптам и типографикой. Обе уже доступны через партнеров: KreaAI, Freepik, LeonardoAI, Replicate и др.
Для исследователей и энтузиастов открыли доступ по запросу к приватной бета-версии FLUX.1 Kontext [dev] с открытыми весами (12B). А чтобы просто потестить возможности, запустили демо - Playground.
bfl.ai
Гугл прокачал Gemini в Drive, и теперь ИИ умеет разбирать не только документы, но и видео. Просто спрашиваете в чате, что внутри ролика — и получаете сводку, ключевые моменты или список задач из записанной встречи. Работает это через чат-интерфейс Gemini. Важно: видео обязательно должны быть с включенными субтитрами, иначе Gemini не справится.
Возможность уже доступна в английской версии Drive для подписчиков Workspace и Google One и AI Premium, а также владельцев корпоративных дополнений Gemini. И еще Гугл добавил в плеер базовую аналитику просмотров — теперь видно, сколько раз видео открывали. Полезно для оценки интереса к вашему контенту.
workspaceupdates.googleblog.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤61👍32🔥12😁5🎄3👌1💔1
This media is not supported in your browser
VIEW IN TELEGRAM
CEO Anthropic Дарио Амодей считает, что такие компании, как его, могут в будущем облагаться специальным налогом — чтобы компенсировать массовую потерю рабочих мест.
Он предупреждает: уже через 1–5 лет ИИ способен вытеснить младший офисный персонал по всему миру.
Даже если Anthropic остановится, говорит Амодей, это ничего не изменит:
«Остальные продолжат. А если нет — нас обгонит Китай».
🚌 «Автобус уже мчится — остановить его нельзя. Но, возможно, мы ещё можем повернуть руль».
📌 Полное интервью: https://www.youtube.com/watch?v=NWxHOrn8-rs
#Anthropic #ai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍94😁60❤22🔥11🥱8🤣6👻5🤔3🤬3🎄2
Media is too big
VIEW IN TELEGRAM
Компания выполнила обещание, выпустив до конца 2025 года полностью персонализируемый голосовой ИИ. Их новая модель EVI 3 третьего поколения объединяет транскрипцию, обработку языка и синтез речи в единый пайплайн. Модель может синтезировать любой голос и эмоцию через промпт и отвечает с задержкой обычного разговора (~300 мс на топовом железе, ~1.2 с в веб-демо), сохраняя качество.
Слепые тесты против GPT-4o показали преимущество EVI 3 в эмпатии, выразительности, скорости и реалистичности. Доступны демо на сайте и в iOS-приложении, API запустят в ближайшие недели. Мультиязычность будет, но в рамках европейских языков.
hume.ai
Согласно свежему отчету Cisco, агентный ИИ кардинально изменит обслуживание клиентов в IT-индустрии. Исследование, охватившее 8000 руководителей, рисует картину массового внедрения "роботов-помощников". Уже к 2028 году такие системы смогут автономно обрабатывать до 68% запросов в службах поддержки технологических компаний.
93% опрошенных уверены: ИИ не только ускорит обработку обращений, но и сделает ее более персонализированной. Хотя автоматизация растет, люди не потеряют работу совсем. 89% респондентов считают, что человеческий контроль в сложных ситуациях останется критически важным, а 96% не сомневаются в ценности личного взаимодействия для клиентов.
81% лидеров считают, что грамотное использование технологии ИИ даст конкурентное преимущество. При этом почти все (99%) требуют от поставщиков прозрачных стратегий управления данными и безопасностью при переходе на ИИ-агентов.
blogs.cisco.com
Odyssey показала прототип технологии, которая генерирует каждый новый кадр на лету, учитывая ваши действия и предыдущий контекст. В отличие от обычных видео-моделей, которые рендерят весь ролик заранее, тут модель предсказывает следующий кадр шаг за шагом каждые 40 мс. Это дает полную интерактивность: будущее сценария видео зависит от только от пользователя.
Правда, пока технология сырая. Чтобы избежать глюков и удержать стабильность, ее обучали на небольшом наборе сцен, жертвуя свободой обзора (нельзя смотреть вверх/вниз). Но компания уже тестирует более универсальную модель с реалистичной физикой.
odyssey.world
Alibaba опубликовала в открытый доступ ROLL, специализированный фреймворк для ускоренного обучения с подкреплением больших языковых моделей. Он решает ключевую проблему: эффективно масштабировать RL-тренировки на кластерах из тысяч GPU. Теперь модели размером до 200+ миллиардов параметров можно обучать быстрее и дешевле.
Под капотом — умная стабилизация обучения: клиппинг градиентов, динамическая фильтрация данных по сложности и нормализация вознаграждений. Все это предотвращает "развал" политики модели при работе с редкими или шумными наградами и дает воспроизводимые результаты без изнурительного подбора гиперпараметров.
В планах — поддержка мультимодальных моделей Qwen и Deepseek V3.
github.com
Google AI Overviews, помощник в поиске, страдал от странного глюка. Когда пользователи спрашивали у него, какой сейчас год, система упорно отвечала, что 2024-й, хотя на календаре уже был 2025 год. Технические специалисты и журналисты, легко воспроизвели эту ошибку.
Компания довольно быстро среагировала и исправила баг чуть меньше, чем за сутки. Правда, в Google не стали углубляться в технические детали сбоя, лишь заявив, что постоянно улучшают поиск и используют подобные инциденты для обновления систем.
Это не первый случай, когда ИИ от Google дает сбой. Ранее их ассистент успел прославиться рекомендацией съедать по одному камню в день (якобы для витаминов!) и советом добавить клей на пиццу, чтобы сыр не падал. История с датой – очередной пример, что даже у топовых ИИ-инструментов порой возникают проблемы с самыми простыми вещами.
techcrunch.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥44❤32👍22😁6
Media is too big
VIEW IN TELEGRAM
Глава NVIDIA Дженсен Хуанг признал немыслимое:
🇨🇳 Китайские ИИ-компании стали по-настоящему сильными.
🇺🇸 Санкции США провалились.
💥 Чипы Huawei уже сравнимы с NVIDIA H200.
И это только начало.
«Китай раньше давал нам 95% выручки. Теперь — лишь 50%.»
«Половина ИИ-учёных мира — в Китае.»
«Они закрывают разрыв и растут экспоненциально.»
🗣️ А вот что Хуанг говорит прямо:
«Я надеюсь, что все ИИ-разработчики будут строить решения на американском технологическом стеке.»
Развивайтесь сколько хотите — но на наших чипах, под нашим контролем.
Но Китай отвечает:
Мы строим не просто модели. Мы строим технологический суверенитет.
🇺🇸→🇨🇳 Санкции, которые ускорили то, что хотели остановить
Все крупнейшие китайские технокомпании сейчас отказываются от чипов Nvidia и переходят на собственные ИИ-процессоры.
Не по желанию — по необходимости. Причина? Экспортные ограничения США.
🎯 А теперь главное:
Изначальная цель этих санкций была не дать Китаю развить своё чипостроение.
А получилось наоборот — вся страна, крупнейший рынок микросхем в мире, переходит на китайские чипы.
Всё, чтобы не зависеть от США.
📉 Иронично, но факт:
Если бы США не сделали ничего, Китай развивал бы отрасль медленно, хаотично, с оглядкой на рынок.
И американские компании (включая ту же Nvidia) продолжали бы доминировать.
А теперь — нет.
@ai_machinelearning_big_data
#news #ai #ml #NVIDIA #usa #china
🇨🇳 Китайские ИИ-компании стали по-настоящему сильными.
🇺🇸 Санкции США провалились.
💥 Чипы Huawei уже сравнимы с NVIDIA H200.
И это только начало.
«Китай раньше давал нам 95% выручки. Теперь — лишь 50%.»
«Половина ИИ-учёных мира — в Китае.»
«Они закрывают разрыв и растут экспоненциально.»
🗣️ А вот что Хуанг говорит прямо:
«Я надеюсь, что все ИИ-разработчики будут строить решения на американском технологическом стеке.»
Развивайтесь сколько хотите — но на наших чипах, под нашим контролем.
Но Китай отвечает:
Мы строим не просто модели. Мы строим технологический суверенитет.
🇺🇸→🇨🇳 Санкции, которые ускорили то, что хотели остановить
Все крупнейшие китайские технокомпании сейчас отказываются от чипов Nvidia и переходят на собственные ИИ-процессоры.
Не по желанию — по необходимости. Причина? Экспортные ограничения США.
🎯 А теперь главное:
Изначальная цель этих санкций была не дать Китаю развить своё чипостроение.
А получилось наоборот — вся страна, крупнейший рынок микросхем в мире, переходит на китайские чипы.
Всё, чтобы не зависеть от США.
📉 Иронично, но факт:
Если бы США не сделали ничего, Китай развивал бы отрасль медленно, хаотично, с оглядкой на рынок.
И американские компании (включая ту же Nvidia) продолжали бы доминировать.
А теперь — нет.
@ai_machinelearning_big_data
#news #ai #ml #NVIDIA #usa #china
❤198🔥101👍66🤣40🤔18😁17👏9👀4🤬2💯1
This media is not supported in your browser
VIEW IN TELEGRAM
Зачем держать миллионы текстов в RAM, если их можно сжать в видео?
Memvid - это решение, которое преобразует текстовые данные в видеофайлы.
И при этом — мгновенно осуществлять поиск по содержимому, с помощью обычных вопросов — как в чате с ИИ.
Никаких векторных БД. Никаких серверов. Только .mp4.
Ключевые фишки:
- Видео = база данных — всё в одном .mp4
- Семантический поиск — задаёшь вопрос — находишь ответ
- Чат-интерфейс — общайся с контентом как с ассистентом
- Импорт PDF — позволяет подгружать документы напрямую
- Мгновенный отклик — поиск за миллисекунды
- 10x сжатие — хранит в 10 раз меньше, чем обычные БД
- Поддержка OpenAI / Anthropic / локальных LLM — на твой выбор
- Индексируй тысячи книг и PDF в один файл
- Сделай себе AI-память по всем заметкам
- Переводи курсы в формат "умного видео"
- Обрабатывай и находи нужное в научных статьях
- Создать свою корпоративную AI-базу — без серверов
pip install memvid
🔗 GitHub
@ai_machinelearning_big_data
#embedded #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤68🔥27🤣24👍18🙉9🤔8🤬4💅3😭1
Forwarded from Анализ данных (Data analysis)
This media is not supported in your browser
VIEW IN TELEGRAM
🏸 Робот, который играет в бадминтон — и делает это всерьёз
Учёные научили четвероногого робота играть в бадминтон. Не просто двигаться — а видеть волан, рассчитывать траекторию, подходить к мячу и точно отбивать его. Всё это в реальном времени, в движении, на настоящей площадке.
🔬 Как это работает:
- 🤖 Reinforcement Learning — робот учится на собственных ошибках
- 👁 Компьютерное зрение — отслеживание волана даже с шумами, как в реальных камерах
- 🧠 Модель предсказания траектории — чтобы "читать" мяч как опытный игрок
- 🦿 Координация движения ног и руки — не падать и успевать отбивать
💥 Что получилось:
Робот реально может играть против человека. Он не просто двигается — он принимает решения, адаптируется и бьёт по мячу в прыжке.
Это не анимация. Это реальный робот. И он уже работает.
@data_analysis_ml
Учёные научили четвероногого робота играть в бадминтон. Не просто двигаться — а видеть волан, рассчитывать траекторию, подходить к мячу и точно отбивать его. Всё это в реальном времени, в движении, на настоящей площадке.
🔬 Как это работает:
- 🤖 Reinforcement Learning — робот учится на собственных ошибках
- 👁 Компьютерное зрение — отслеживание волана даже с шумами, как в реальных камерах
- 🧠 Модель предсказания траектории — чтобы "читать" мяч как опытный игрок
- 🦿 Координация движения ног и руки — не падать и успевать отбивать
💥 Что получилось:
Робот реально может играть против человека. Он не просто двигается — он принимает решения, адаптируется и бьёт по мячу в прыжке.
Это не анимация. Это реальный робот. И он уже работает.
@data_analysis_ml
❤81👍40🔥29🤣6🤩5🥱2🎄2
Machinelearning
Это обусловлено высоким спросом со стороны бизнеса на ИИ, в сфере генерации кода.
🆚 OpenAI, главный конкурент Anthropic, по данным источников, ожидает $12+ млрд выручки к концу 2025 года, по сравнению с $3,7 млрд в прошлом году. Однако эта сумма включает весь доход, а не только годовую прогнозируемую выручку (ARR), как у Anthropic. Reuters не удалось определить ARR OpenAI.
Anthropic продолжают развивать линейку Claude и усиливает позицию как B2B-ориентированный аналог OpenAI.
@ai_machinelearning_big_data
#Anthropic #ai #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍131❤44🔥26🤷6🤩5🎄2🤣1🗿1
Новый XChat теперь доступен с шифрованием, самоуничтожением сообщений, возможностью отправки любых типов файлов и поддержкой аудио- и видеозвонков.
Приложение создано на Rust и использует шифрование (как в Биткойн) и новую архитектуру.
А еще можно звонить без номера телефона.
https://x.com/elonmusk/status/1929238157872312773
@ai_machinelearning_big_data
#elonmusk #ai #news #ml #grok
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣176👍54❤33🔥12🤷♂5🥱3😁2🥰1💯1