tgoop.com/anthropology_eu/1028
Last Update:
Антропологи в перерывах на конференциях всё чаще обсуждают новые возможности автоматической расшифровки с помощью искусственного интеллекта. По мотивам недавних разговоров публикуем небольшой список и надеемся, что он окажется полезным.
1. Whisper. Приложение для macOS, которое работает на нейросети Whisper от компании OpenAI. Кажется, его знают все антропологи, и хоть раз, да пользовались. Бесплатно доступны две модели, их нужно предварительно скачать. Язык определяется автоматически. Однако качество расшифровки оставляет желать лучшего, также программа не распознает нескольких говорящих, всё переводится сплошным текстом.
2. Riverside. Главная проблема всех автоматических расшифровщиков — они хотят денег (как и люди, но люди и расшифровывают лучше). У Риверсайда есть бесплатные два часа расшифровки, которые из аналогичных доступных кажутся самыми оптимальным по качеству. Если вдруг у вас где-то лежит пара нерасшифрованных интервью, то можно попробовать прогнать их через Риверсайд. Из минусов — тоже не разделяет спикеров в диалоге и не поддерживает популярный формат M4A.
3. Memo AI. Мы горячо рекомендуем именно этот телеграм-бот для расшифровки. Он платный, но по качеству пока что остается самым лучшим, поддерживает более 50 языков. Во-первых, бот может расшифровывать файлы до 500 МБ, а это до 4-х часов аудио за раз. Значит не надо тратить время на нарезку. Во-вторых, расшифровщик с поразительной точностью разделяет интервью на вопрос-ответ, напишет краткое содержание разговора и даже по запросу сделает семантический анализ текста.
Если у вас групповой проект, то можно добавить в общий телеграм-чат бота Memo AI. После этого все участники чата смогут использовать транскрибацию за счет минут создателя группового чата. Советуем лишь потому, что сами регулярно пользуемся именно этим ботом.
BY Факультет антропологии ЕУСПб
Share with your friend now:
tgoop.com/anthropology_eu/1028