tgoop.com/le_kekek/2504
Last Update:
Столкнулся с проблемой, что книги, которые я сейчас хочу почитать не имеют аудио версии (а читать глазами я их не буду). В связи с этим обнаружил, что нейросети синтеза голоса достаточно преисполнились, чтобы сносно озвучивать книги. На github уже есть решения позволяющие делать это с помощью мультилингвистических моделей (ebook2audiobook например), но они не умеют ставить ударения на русском, в связи с чем получается каша, которую, да, можно слушать, но тяжело (удовлетворительно звучит)
Есть русскоязычные модели, которые, как раз хорошо справляются с этой задачей (можно потестить https://huggingface.co/spaces/TeraTTS/TTS звучит уже хорошо), но для них нет готового инструментария, чтобы можно было просто скинуть книгу и сказать "озвучь" и ждать. Поэтому в течении января буду дербанить готовые приложения с целью сделать приложение, которое будет озвучивать аудиокниги (я словил средней силы гиперфокус), stay tuned
BY шаяртулар
Share with your friend now:
tgoop.com/le_kekek/2504