tgoop.com/blockchainRF/11068
Last Update:
Карта рынка голосовых ИИ: итоги 2024 и прогнозы на 2025, отчет Cartesia
В 2024 появились полноценные разговорные системы, объединяющие распознавание речи, языковые модели и синтез речи в единое целое. OpenAI представила голосовой режим в ChatGPT, а такие компании как Kyutai создали системы, способные слушать пользователя во время собственной речи — важный шаг к естественному диалогу.
Стоимость использования языковых моделей упала в разы: с $45 до $2.75 за миллион токенов. При этом качество распознавания и синтеза речи значительно выросло.
Интерес к голосовым технологиям стремительно растет — количество стартапов в этой области в Y Combinator увеличилось на 70% между зимним и осенним наборами 2024 года. Голосовые ИИ-помощники активно внедряются в:
- Здравоохранение: запись к врачу, напоминания о приеме лекарств
- Страхование: обработка претензий и продление полисов
- Логистику: отслеживание грузов и планирование
- Гостиничный бизнес: бронирование и обслуживание
- Малый бизнес: автоматизация телефонных звонков
Что ждет нас в 2025 году?
1. Ожидается появление более совершенных систем преобразования речи в речь с задержкой всего 160 мс (для сравнения: у человека — 230 мс). Они будут лучше понимать контекст, эмоции и справляться с перебиваниями в разговоре.
2. Развитие компактных моделей позволит использовать голосовых ассистентов без интернета — на телефонах, в автомобилях и различных устройствах. Это обеспечит мгновенный отклик и полную приватность данных.
3. Голосовые ассистенты начнут справляться с комплексными задачами. Например, при обращении в авиакомпанию ИИ сможет самостоятельно проверить бронирование, найти альтернативные рейсы и внести изменения в билет — все в рамках одного естественного разговора.
2025 год обещает стать годом массового внедрения голосовых технологий.
BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Share with your friend now:
tgoop.com/blockchainRF/11068