Обновлённый Riffusion теперь разбивает треки на вокал и инструменты
Нейросеть Riffusion получила мощный апдейт и стала ещё ближе к роли главного генератора музыки. Теперь она умеет отдельно понимать вокал и инструментал, что открывает новые возможности:
— Загрузите песню и сделайте кавер: оставьте вокал, замените музыку (или наоборот).
— С помощью функции Get Stems можно разбить трек на отдельные дорожки.
— Алгоритм адаптируется под ваш вкус — чем больше вы создаёте, тем точнее он попадает в настроение.
— Всё это по-прежнему бесплатно.
Пробуем тут
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot 💬
Нейросеть Riffusion получила мощный апдейт и стала ещё ближе к роли главного генератора музыки. Теперь она умеет отдельно понимать вокал и инструментал, что открывает новые возможности:
— Загрузите песню и сделайте кавер: оставьте вокал, замените музыку (или наоборот).
— С помощью функции Get Stems можно разбить трек на отдельные дорожки.
— Алгоритм адаптируется под ваш вкус — чем больше вы создаёте, тем точнее он попадает в настроение.
— Всё это по-прежнему бесплатно.
Пробуем тут
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Генератор треков теперь может скопировать голос любого исполнителя и создать на его основе полноценную песню. Достаточно закинуть аудио-файл или вставить ссылку на YouTube.
Например, можете послушать, как ИИ справился с клонированием голоса Леди Гаги, Тейлор Свифт и Джастина Бибера
Также тут есть:
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Нашли для вас ЛУЧШУЮ тулзу для очистки звука от шумов — Auphonic.
Это ультимативный сервис для работы со звуком: вычищает шумы из аудиодорожки, обрезает моменты тишины, или просто отделяет музыку от вокала.
Можно пользоваться бесплатно — ежемесячно дают 2 часа обработки аудио. Если не записываете подкасты каждый день — хватит с головой.
Забираем имбу — здесь.
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot 💬
Это ультимативный сервис для работы со звуком: вычищает шумы из аудиодорожки, обрезает моменты тишины, или просто отделяет музыку от вокала.
Можно пользоваться бесплатно — ежемесячно дают 2 часа обработки аудио. Если не записываете подкасты каждый день — хватит с головой.
Забираем имбу — здесь.
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Релизнулся лучший генератор переводов и озвучек видео — Krilliin AI сможет сделать субтитры даже для сложнейших видео с тараторящим спикером.
Зацените фишки:
• Генерит точнейшие субтитры.
• Клонировать ЛЮБОЙ голос.
• Озвучивать ролики.
• Автоматически конвертировать видео под TikTok или YouTube.
• Знает 56 (!) языков, в том числе РУССКИЙ.
• БЕСПЛАТНО.
Забираем мегатулзу — здесь.
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot 💬
Зацените фишки:
• Генерит точнейшие субтитры.
• Клонировать ЛЮБОЙ голос.
• Озвучивать ролики.
• Автоматически конвертировать видео под TikTok или YouTube.
• Знает 56 (!) языков, в том числе РУССКИЙ.
• БЕСПЛАТНО.
Забираем мегатулзу — здесь.
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
Нейросеть сгенерит ЛЮБОЙ звук — подъехал мастхев для саунддизайнеров. SFХengine создает звуки от животных и погоды до технических шумов под разнообразные задачи.
• Генерит ЛЮБЫЕ звуки до 47 секунд.
• Никакого копирайта — результат полностью ВАШ.
• Можно использовать уже готовые варианты из огромной библиотеки треков.
• БЕСПЛАТНО.
Мегатулза для работы со звуком — тут.
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot 💬
• Генерит ЛЮБЫЕ звуки до 47 секунд.
• Никакого копирайта — результат полностью ВАШ.
• Можно использовать уже готовые варианты из огромной библиотеки треков.
• БЕСПЛАТНО.
Мегатулза для работы со звуком — тут.
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
⚡️ Имба: тулза NotebookLM от Google теперь умеет генерить ПОДКАСТЫ на русском языке!
Просто закиньте любой документ, нажмите «Аудиопересказ» — «Сгенерировать» и наслаждайтесь. По традиции, проверили обнову на пасте про батин суп☕️
Это беспатно, залетаем.
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot 💬
Просто закиньте любой документ, нажмите «Аудиопересказ» — «Сгенерировать» и наслаждайтесь. По традиции, проверили обнову на пасте про батин суп
Это беспатно, залетаем.
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Suno снова король — вышла новая модель V4.5, которую не отличить от реальной музыки.
— Завезли КУЧУ новых жанров;
— Звук теперь более сложный и чёткий;
— Почти не разваливается под конец песни;
— Инструменты теперь звучат как ОТДЕЛЬНЫЕ инструменты, а не как каша звуков;
— Самое безумное: генерит треки до ВОСЬМИ МИНУТ!
Пробуем — здесь, пока только для обладателей подписки.
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot 💬
— Завезли КУЧУ новых жанров;
— Звук теперь более сложный и чёткий;
— Почти не разваливается под конец песни;
— Инструменты теперь звучат как ОТДЕЛЬНЫЕ инструменты, а не как каша звуков;
— Самое безумное: генерит треки до ВОСЬМИ МИНУТ!
Пробуем — здесь, пока только для обладателей подписки.
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Парень протестировал все популярные платформы и составил топ-4. Ловите список в порядке возрастания:
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
• Это ПЕРВАЯ модель, которая понимает знаки препинания, отличает контекст и даже отмечает паузы в речи.
• Очищает записи от лишнего шума — можно транскрибировать даже лекцию в оживленной аудитории.
• Идеально распознает песни, числа, видосы и записи ЛЮБОЙ длины.
• БЕСПЛАТНО.
• БЕЗ регистрации.
Юзаем в браузере — тут. Качаем на комп и работаем локально — здесь.
_
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Google релизнул ГЕНЕРАТОР РЕЧИ — Gemini теперь может озвучить вам любой текст БЕСПЛАТНО.
У нейронки огромная библиотека голосов, при этом все поддерживают русский язык. Самое крутое: можно прописывать текстовые промты вроде *смех* или *кашель* и сгенерированный голос реально будет смеяться.
Летим на AI Studio, выбираем Generate Media, а затем Gemini Speech Generation. Это бесплатно, пользуйтесь.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot 💬
У нейронки огромная библиотека голосов, при этом все поддерживают русский язык. Самое крутое: можно прописывать текстовые промты вроде *смех* или *кашель* и сгенерированный голос реально будет смеяться.
Летим на AI Studio, выбираем Generate Media, а затем Gemini Speech Generation. Это бесплатно, пользуйтесь.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Транскрибируем аудио и видео в текст — БЕСПЛАТНО и полностью офлайн!
Тулзу WizWhisp на базе OpenAI Whisper можно развернуть локально на своём компе — и вытащить текст из ЛЮБОГО файла.
• Поддерживает MP3, MP3, WAV, M4A, AVI и кучу других форматов
• Понимает более 90 языков
• Интервью, лекции, подкасты, видеозвонки и просто видосы — текст можно выжать откуда угодно
• Можно запускать локально как на CUDA и GPU, так и на CPU.
Забираем имбу тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot 💬
Тулзу WizWhisp на базе OpenAI Whisper можно развернуть локально на своём компе — и вытащить текст из ЛЮБОГО файла.
• Поддерживает MP3, MP3, WAV, M4A, AVI и кучу других форматов
• Понимает более 90 языков
• Интервью, лекции, подкасты, видеозвонки и просто видосы — текст можно выжать откуда угодно
• Можно запускать локально как на CUDA и GPU, так и на CPU.
Забираем имбу тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
• Идеально подбирает эмоции — нейронка умеет копировать человеческие паузы, вздохи, запинки и даже переходить на шёпот или крик.
• Можно САМОМУ выбирать, в какой части текста использовать нужную эмоцию.
• Есть выбор из популярных голосов, например, Маск или Трамп.
• Умеет копировать ЛЮБЫЕ голоса — нужно всего 15 секунд речи.
• Размер текста неважен — озвучивайте видео, аудиокниги и даже реплики героев для своих игр!
Сохраняем — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Suno обновил аудиоредактор
Теперь можно извлечь из трека до 12 отдельных аудиодорожек с разными инструментами.
Также можно загружать и редактировать свои треки продолжительностью до 8 минут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot 💬
Теперь можно извлечь из трека до 12 отдельных аудиодорожек с разными инструментами.
Также можно загружать и редактировать свои треки продолжительностью до 8 минут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Конвертируем 3000+ типов файлов — вышел лучший в мире сайт How to Convert, который поддерживает ВСЕ расширения.
• Любые форматы: видео, фото, аудио и документы.
• Доступно везде: на Mac, Windows и Linux.
• Работает локально на вашем компе.
Сохраняйте — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot 💬
• Любые форматы: видео, фото, аудио и документы.
• Доступно везде: на Mac, Windows и Linux.
• Работает локально на вашем компе.
Сохраняйте — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
Kokoro — озвучка любых текстов за полминуты.
Работает локально. Бесплатно. Без лимитов.
– один раз качаешь модель
– пихаешь туда текст
– получаешь живую речь
голосовые подкасты, видосы, сторисы — без монтажа и без бюджета.
Пробуем тут
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot 💬
Работает локально. Бесплатно. Без лимитов.
– один раз качаешь модель
– пихаешь туда текст
– получаешь живую речь
голосовые подкасты, видосы, сторисы — без монтажа и без бюджета.
Пробуем тут
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Релизнулся ТОПОВЫЙ сервис для транскрибации аудио и видосов в текст — TranscribeAI вытащит текст из любого медиа, даже если там куча бубнежа и помех.
• Внутри — Whisper от OpenAI. Проблем с переводом и текстами точно не будет.
• Поддерживает больше 100 языков и ЗНАЕТ русский.
• Съедает файлы до 4 ГБ во всех популярных форматах — MP3, WAV, MP4, AVI, MOV, MKV.
• Перегонит все в текстовый файл, расставит таймкоды и все маркеры. Может создать субтитры в формате SRT.
• Мастхев для расшифровки созвонов, лекций, курсов, роликов или подкастов.
• БЕЗ ограничений, БЕЗ регистрации.
😶 😶 😶 😶 😶 😶 😶 😶 😶
Сохраняем суперпомощника — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot 💬
• Внутри — Whisper от OpenAI. Проблем с переводом и текстами точно не будет.
• Поддерживает больше 100 языков и ЗНАЕТ русский.
• Съедает файлы до 4 ГБ во всех популярных форматах — MP3, WAV, MP4, AVI, MOV, MKV.
• Перегонит все в текстовый файл, расставит таймкоды и все маркеры. Может создать субтитры в формате SRT.
• Мастхев для расшифровки созвонов, лекций, курсов, роликов или подкастов.
• БЕЗ ограничений, БЕЗ регистрации.
Сохраняем суперпомощника — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
Ловите новую модель для работы с аудио от Mistral
Voxtral работает с аудио-записями длиной до 40 минут. Модель умеет транскрибировать и анализировать записи, а это значит, что вы можете задавать вопросы по аудио напрямую модели или же скопировать полученный текст и закинуть его в другую AI.
Voxtral появится в Le Chat
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot
Voxtral работает с аудио-записями длиной до 40 минут. Модель умеет транскрибировать и анализировать записи, а это значит, что вы можете задавать вопросы по аудио напрямую модели или же скопировать полученный текст и закинуть его в другую AI.
Voxtral появится в Le Chat
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Suno вернулся — вышла новая модель Suno v4.5+ 😇
Обещают улучшенный звук, но главная фишка модели в почти идеальной генерации audio2audio — закидываете свой вокал или наоборот, бит и превращаете его в полноценную песню.
Пробуем имбу — здесь.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot
Обещают улучшенный звук, но главная фишка модели в почти идеальной генерации audio2audio — закидываете свой вокал или наоборот, бит и превращаете его в полноценную песню.
Пробуем имбу — здесь.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
T-Технологии выкатили в опенсорс модель для потокового распознавания речи — T-one.
Она мгновенно превращает разговор в текст — идеально для звонков и голосовых помощников. Модель лёгкая, быстрая и заточена под реальные условия: шумы, плохое качество связи и нестабильный интернет.
Разрабы также дали подробные инструкции — модель можно легко дообучить под свои нужды или встроить в продукт.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot
Она мгновенно превращает разговор в текст — идеально для звонков и голосовых помощников. Модель лёгкая, быстрая и заточена под реальные условия: шумы, плохое качество связи и нестабильный интернет.
Разрабы также дали подробные инструкции — модель можно легко дообучить под свои нужды или встроить в продукт.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1