AIHAPPENS Telegram 289
Мы в одном чате выяснили, чем пользуется Telegram для расшифровки аудио. Ответ окажется очевидным, но путь к нему интересный.

Хронология:

- Я отправляю аудиосообщение в чат, его расшифровывает друг, и в конце видит следующий текст: "Ну, в общем, мы это узнаем завтра. Зав. Редактор субтитров А. Семкин, Корректор А. Егорова". Я, конечно, так не заканчивал своё сообщение, но это хорошо, что не "directed by Robert B. Weide".
- Мы гуглим и находим интересную тему на GitHub: https://github.com/openai/whisper/discussions/928, где люди описывают баги расшифровки Whisper:
1. Иногда он выводит (на французском) ❤️ Translated by Amara.org Community.
2. Когда музыка затихает, он выводит: "Thank you for watching".
3. Во время проигрывания закрывающей темы: Legendas pela comunidade Amara.org.
- И так далее.

Что интересного в теме: там есть список фраз, которые встречаются как артефакты, и если вы используете Whisper в проде, то можете их просто исключить. Для РФ это, например, "ru": ["Редактор субтитров А.Синецкая, Корректор А.Егорова"].

Саммари:

1. Telegram перешёл с Google на Whisper (раньше точно был Google, и было стрёмно, что данные уходили ещё и туда).
2. Whisper обучали на данных сериалов, в том числе с странных платформ, но на комбинации звука и субтитров.
3. Если вы используете Whisper, возьмите из ссылки выше слова, которые надо вырезать из текста (это сообщение специально для Паши Д.).
4. Генеративные модели смешно галлюцинируют 🙂

@aihappens
😁95👍26🔥2212🤪6



tgoop.com/aihappens/289
Create:
Last Update:

Мы в одном чате выяснили, чем пользуется Telegram для расшифровки аудио. Ответ окажется очевидным, но путь к нему интересный.

Хронология:

- Я отправляю аудиосообщение в чат, его расшифровывает друг, и в конце видит следующий текст: "Ну, в общем, мы это узнаем завтра. Зав. Редактор субтитров А. Семкин, Корректор А. Егорова". Я, конечно, так не заканчивал своё сообщение, но это хорошо, что не "directed by Robert B. Weide".
- Мы гуглим и находим интересную тему на GitHub: https://github.com/openai/whisper/discussions/928, где люди описывают баги расшифровки Whisper:
1. Иногда он выводит (на французском) ❤️ Translated by Amara.org Community.
2. Когда музыка затихает, он выводит: "Thank you for watching".
3. Во время проигрывания закрывающей темы: Legendas pela comunidade Amara.org.
- И так далее.

Что интересного в теме: там есть список фраз, которые встречаются как артефакты, и если вы используете Whisper в проде, то можете их просто исключить. Для РФ это, например, "ru": ["Редактор субтитров А.Синецкая, Корректор А.Егорова"].

Саммари:

1. Telegram перешёл с Google на Whisper (раньше точно был Google, и было стрёмно, что данные уходили ещё и туда).
2. Whisper обучали на данных сериалов, в том числе с странных платформ, но на комбинации звука и субтитров.
3. Если вы используете Whisper, возьмите из ссылки выше слова, которые надо вырезать из текста (это сообщение специально для Паши Д.).
4. Генеративные модели смешно галлюцинируют 🙂

@aihappens

BY AI Happens


Share with your friend now:
tgoop.com/aihappens/289

View MORE
Open in Telegram


Telegram News

Date: |

On Tuesday, some local media outlets included Sing Tao Daily cited sources as saying the Hong Kong government was considering restricting access to Telegram. Privacy Commissioner for Personal Data Ada Chung told to the Legislative Council on Monday that government officials, police and lawmakers remain the targets of “doxxing” despite a privacy law amendment last year that criminalised the malicious disclosure of personal information. How to create a business channel on Telegram? (Tutorial) Matt Hussey, editorial director at NEAR Protocol also responded to this news with “#meIRL”. Just as you search “Bear Market Screaming” in Telegram, you will see a Pepe frog yelling as the group’s featured image. Telegram is a leading cloud-based instant messages platform. It became popular in recent years for its privacy, speed, voice and video quality, and other unmatched features over its main competitor Whatsapp.
from us


Telegram AI Happens
FROM American