PROMPTLAB_MOZLAB Telegram 101
Как сделать идеальную расшифровку аудио и саммари выступления. Открытый эксперимент

Привет, коллеги! Я уже писал, что вижу огромную ценность в том, чтобы показывать как можно более свежие кейсы применения нейросетей. Однако корпоративные выступления или примеры опубликовать по понятным причинам возможности нет, поэтому мы активно их создаем.

Сегодня мы решили показать, как можно получить качественную (надеюсь!) расшифровку аудио и что для этого потребуется. Это очень востребовано, например, на корпоративных конференциях. Особенно в сессиях вопросов и ответов (где нет презентации, по которой можно хоть как-то представить себе, о чем говорил спикер, если участник опоздал).

Расшифровка позволяет кратно экономить время на ознакомление с выступлением, а в бизнесе время сотрудников = деньги. Кроме того, ограниченный , скажем, пятиминутный, ресурс мотивации сотрудника может быть бесполезно израсходован на первые пять минут просмотра длинного видео… а при работе с текстом за это время удастся найти все самое важное!

Мы будем рассказывать о каждом шаге эксперимента;)

1. Выбрать спикера и договориться с ним о возможности расшифровки и о размещении оборудования;)

Мы выбрали хорошо вам известного Володю Казакова (он пишет про нейросети здесь, очень рекомендую его канал!), который часто сотрудничает с нашей Лабораторией промптинга. Он согласился на то, что его выступление будет расшифровано и предоставлено в открытый доступ*.

* — хах, это не самый простой вопрос, на самом деле;) вы когда-нибудь задумывались о том, что не все спикеры к этому готовы (да-да!) — потому что контент, неплохо звучащий устно, вполне может оказаться не столь прекрасным после расшифровки

На Володе мы разместили блютус-гарнитуру (в комментах фотка, мы выбирали из соображений адекватной цены и качества выше среднего, эта стоит 11тр и дает адекватное качество), чтобы минимизировать искажения. Это важно! Потому что звук, который запишет ваш телефон из зала, не даст расшифровщику качественно «прочувствовать» интонацию, чтобы расставить знаки препинания, а еще — повысит вероятность искажений.

Учитывая, что мотивация получить запись обратно пропорциональна времени, прошедшему с момента завершения выступления, и позволив себе вложить 10-20 минут на редакторскую правку текста, вы потеряете от 30 до 50% желающих получить расшифровку, то получается, что качественная расшифровка «с пылу с жару» нужна СРАЗУ. Поэтому не редактирование, а изначально высокое качество записи. Это еще и дешевле (единожды купить гарнитуру по сравнению с постоянной оплатой редактора).

2. Записать файл и отправить его на расшифровку нейросети

Берём mp3-файл на максималках и отправляем на расшифровку. До прошлой недели мы использовали Whisper AI. По результатам наших тестов он был лучшим. К тому же, его можно развернуть на локальной машине (правда, только на мощной) и тогда он решал вопрос конфиденциальности.

В этот раз мы попробуем и покажем вам новый сервис (ссылка и рецензия — в комментариях). Цена показалась довольно высокой, но качеством мы на данный момент довольны. Если вы знаете достойный или лучший аналог — пишите в комментарии! Вообще мне кажется, что в этой прикладной гонке сейчас будет постоянно меняться лидер…

3. Разместить в удобном месте и — наслаждаться!

Вот ссылка на расшифрованное выступление Володи. Это сделала нейросеть (Voicee, подробнее про неё здесь). Важно понимать, что Я НИЧЕГО НЕ ТРОГАЛ ВНУТРИ, только отрезал свою болтовню в начале и в конце.

Я успел посмотреть, мне очень понравилось качество. Единственная опечатка, которую я бегло заметил — это «Ежка» вместо «Джипитишки» (Володя имел в виду ChatGPT, сделав название уменьшительно-ласкательным и на русский манер). С другой стороны, а как вообще нейросеть сможет такое понять…

Хотя о! Я попробую сделать это промптом;)

4. Сделать саммари ключевых идей с помощью другой нейросети

(в следующем посте 👇 👇 👇)

в каталог промптов и кейсов применения нейросетей (20 кейсов!)

в Лабораторию промптинга МОЗЛаб: посмотреть и заказать обучение ваших сотрудников
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥12👍5



tgoop.com/PromptLab_Mozlab/101
Create:
Last Update:

Как сделать идеальную расшифровку аудио и саммари выступления. Открытый эксперимент

Привет, коллеги! Я уже писал, что вижу огромную ценность в том, чтобы показывать как можно более свежие кейсы применения нейросетей. Однако корпоративные выступления или примеры опубликовать по понятным причинам возможности нет, поэтому мы активно их создаем.

Сегодня мы решили показать, как можно получить качественную (надеюсь!) расшифровку аудио и что для этого потребуется. Это очень востребовано, например, на корпоративных конференциях. Особенно в сессиях вопросов и ответов (где нет презентации, по которой можно хоть как-то представить себе, о чем говорил спикер, если участник опоздал).

Расшифровка позволяет кратно экономить время на ознакомление с выступлением, а в бизнесе время сотрудников = деньги. Кроме того, ограниченный , скажем, пятиминутный, ресурс мотивации сотрудника может быть бесполезно израсходован на первые пять минут просмотра длинного видео… а при работе с текстом за это время удастся найти все самое важное!

Мы будем рассказывать о каждом шаге эксперимента;)

1. Выбрать спикера и договориться с ним о возможности расшифровки и о размещении оборудования;)

Мы выбрали хорошо вам известного Володю Казакова (он пишет про нейросети здесь, очень рекомендую его канал!), который часто сотрудничает с нашей Лабораторией промптинга. Он согласился на то, что его выступление будет расшифровано и предоставлено в открытый доступ*.

* — хах, это не самый простой вопрос, на самом деле;) вы когда-нибудь задумывались о том, что не все спикеры к этому готовы (да-да!) — потому что контент, неплохо звучащий устно, вполне может оказаться не столь прекрасным после расшифровки

На Володе мы разместили блютус-гарнитуру (в комментах фотка, мы выбирали из соображений адекватной цены и качества выше среднего, эта стоит 11тр и дает адекватное качество), чтобы минимизировать искажения. Это важно! Потому что звук, который запишет ваш телефон из зала, не даст расшифровщику качественно «прочувствовать» интонацию, чтобы расставить знаки препинания, а еще — повысит вероятность искажений.

Учитывая, что мотивация получить запись обратно пропорциональна времени, прошедшему с момента завершения выступления, и позволив себе вложить 10-20 минут на редакторскую правку текста, вы потеряете от 30 до 50% желающих получить расшифровку, то получается, что качественная расшифровка «с пылу с жару» нужна СРАЗУ. Поэтому не редактирование, а изначально высокое качество записи. Это еще и дешевле (единожды купить гарнитуру по сравнению с постоянной оплатой редактора).

2. Записать файл и отправить его на расшифровку нейросети

Берём mp3-файл на максималках и отправляем на расшифровку. До прошлой недели мы использовали Whisper AI. По результатам наших тестов он был лучшим. К тому же, его можно развернуть на локальной машине (правда, только на мощной) и тогда он решал вопрос конфиденциальности.

В этот раз мы попробуем и покажем вам новый сервис (ссылка и рецензия — в комментариях). Цена показалась довольно высокой, но качеством мы на данный момент довольны. Если вы знаете достойный или лучший аналог — пишите в комментарии! Вообще мне кажется, что в этой прикладной гонке сейчас будет постоянно меняться лидер…

3. Разместить в удобном месте и — наслаждаться!

Вот ссылка на расшифрованное выступление Володи. Это сделала нейросеть (Voicee, подробнее про неё здесь). Важно понимать, что Я НИЧЕГО НЕ ТРОГАЛ ВНУТРИ, только отрезал свою болтовню в начале и в конце.

Я успел посмотреть, мне очень понравилось качество. Единственная опечатка, которую я бегло заметил — это «Ежка» вместо «Джипитишки» (Володя имел в виду ChatGPT, сделав название уменьшительно-ласкательным и на русский манер). С другой стороны, а как вообще нейросеть сможет такое понять…

Хотя о! Я попробую сделать это промптом;)

4. Сделать саммари ключевых идей с помощью другой нейросети

(в следующем посте 👇 👇 👇)

в каталог промптов и кейсов применения нейросетей (20 кейсов!)

в Лабораторию промптинга МОЗЛаб: посмотреть и заказать обучение ваших сотрудников

BY Лаборатория Промптинга Замышляева


Share with your friend now:
tgoop.com/PromptLab_Mozlab/101

View MORE
Open in Telegram


Telegram News

Date: |

The best encrypted messaging apps Choose quality over quantity. Remember that one high-quality post is better than five short publications of questionable value. Commenting about the court's concerns about the spread of false information related to the elections, Minister Fachin noted Brazil is "facing circumstances that could put Brazil's democracy at risk." During the meeting, the information technology secretary at the TSE, Julio Valente, put forward a list of requests the court believes will disinformation. The Standard Channel A few years ago, you had to use a special bot to run a poll on Telegram. Now you can easily do that yourself in two clicks. Hit the Menu icon and select “Create Poll.” Write your question and add up to 10 options. Running polls is a powerful strategy for getting feedback from your audience. If you’re considering the possibility of modifying your channel in any way, be sure to ask your subscribers’ opinions first.
from us


Telegram Лаборатория Промптинга Замышляева
FROM American