GITVERSENEWS Telegram 766
#GitVerseКейс

Смотри, какой репозиторий! 🚀

Вторник крутых реп! Сегодня в центре вашего внимания – локальная платформа транскрибации речи Speach. Проект не только переводит аудио в текст, но и автоматически распознает спикеров и создает аналитическую сводку благодаря интеграции с современными моделями машинного обучения. Посмотрим, что под капотом?

О проекте 🖱

Speach – это универсальное решение для обработки голосовых записей и автоматического анализа разговоров. Платформа состоит из веб-интерфейса на PHP, вычислительного воркера на Python и вспомогательных инструментов для мониторинга процессов и хранения результатов. Система поддерживает работу в локальном режиме, обеспечивая безопасность конфиденциальных данных.

Возможности платформы:

Локальная транскрипция аудио файлов с поддержкой форматов MP3, WAV, M4A, FLAC, OGG, MP4.
Автоматическое выделение отдельных спикеров с помощью технологии NeMo.
Генерация кратких аналитических отчетов и ключевых моментов встречи через AI-модели (например, Ollama).
Полностью автономная работа без отправки данных в облачные сервисы.
Интеграция с хранилищем данных SQLite для удобства развертывания и эксплуатации.
Использование мощных технологий, таких как Whisper, NeMo и Ollama для качественного преобразования звука в текст.

Архитектура проекта 💡

Платформа имеет модульную структуру, позволяющую легко расширять функциональность и настраивать производительность:

📌Web – Интерфейс на PHP (нужно установить nginx/php-fpm) обеспечивает удобную среду для загрузки аудио и мониторинга прогресса.
📌Worker – Python-код (использует PyTorch, whispher.cpp, NeMo и Ollama) обрабатывает аудио-файлы и формирует финальный результат.
📌Мониторинг – Скрипты контролируют выполнение задач и обеспечивают стабильность системы.
📌Docker – Возможность запуска компонентов в контейнерах для изоляции и воспроизводимости среды.

🤫И еще один маленький секрет: этот проект – результат вайбкодинга

Переходите в репозиторий, изучайте код и тестируйте транскрибатор! 👍

КОД БЕЗ ГРАНИЦ | GitVerse запускает гранты
Please open Telegram to view this post
VIEW IN TELEGRAM
156🔥2



tgoop.com/gitversenews/766
Create:
Last Update:

#GitVerseКейс

Смотри, какой репозиторий! 🚀

Вторник крутых реп! Сегодня в центре вашего внимания – локальная платформа транскрибации речи Speach. Проект не только переводит аудио в текст, но и автоматически распознает спикеров и создает аналитическую сводку благодаря интеграции с современными моделями машинного обучения. Посмотрим, что под капотом?

О проекте 🖱

Speach – это универсальное решение для обработки голосовых записей и автоматического анализа разговоров. Платформа состоит из веб-интерфейса на PHP, вычислительного воркера на Python и вспомогательных инструментов для мониторинга процессов и хранения результатов. Система поддерживает работу в локальном режиме, обеспечивая безопасность конфиденциальных данных.

Возможности платформы:

Локальная транскрипция аудио файлов с поддержкой форматов MP3, WAV, M4A, FLAC, OGG, MP4.
Автоматическое выделение отдельных спикеров с помощью технологии NeMo.
Генерация кратких аналитических отчетов и ключевых моментов встречи через AI-модели (например, Ollama).
Полностью автономная работа без отправки данных в облачные сервисы.
Интеграция с хранилищем данных SQLite для удобства развертывания и эксплуатации.
Использование мощных технологий, таких как Whisper, NeMo и Ollama для качественного преобразования звука в текст.

Архитектура проекта 💡

Платформа имеет модульную структуру, позволяющую легко расширять функциональность и настраивать производительность:

📌Web – Интерфейс на PHP (нужно установить nginx/php-fpm) обеспечивает удобную среду для загрузки аудио и мониторинга прогресса.
📌Worker – Python-код (использует PyTorch, whispher.cpp, NeMo и Ollama) обрабатывает аудио-файлы и формирует финальный результат.
📌Мониторинг – Скрипты контролируют выполнение задач и обеспечивают стабильность системы.
📌Docker – Возможность запуска компонентов в контейнерах для изоляции и воспроизводимости среды.

🤫И еще один маленький секрет: этот проект – результат вайбкодинга

Переходите в репозиторий, изучайте код и тестируйте транскрибатор! 👍

КОД БЕЗ ГРАНИЦ | GitVerse запускает гранты

BY GitVerse News




Share with your friend now:
tgoop.com/gitversenews/766

View MORE
Open in Telegram


Telegram News

Date: |

Telegram desktop app: In the upper left corner, click the Menu icon (the one with three lines). Select “New Channel” from the drop-down menu. Image: Telegram. Telegram users themselves will be able to flag and report potentially false content. Other crimes that the SUCK Channel incited under Ng’s watch included using corrosive chemicals to make explosives and causing grievous bodily harm with intent. The court also found Ng responsible for calling on people to assist protesters who clashed violently with police at several universities in November 2019. With the sharp downturn in the crypto market, yelling has become a coping mechanism for many crypto traders. This screaming therapy became popular after the surge of Goblintown Ethereum NFTs at the end of May or early June. Here, holders made incoherent groaning sounds in late-night Twitter spaces. They also role-played as urine-loving Goblin creatures.
from us


Telegram GitVerse News
FROM American