This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Llama 3.2 с ультрареалистичным звуком
> поддерживает клонирование голоса на английском и китайском языках
> обучен на 250 тысяч часов аудио
> модели 1B, 3B (скоро будет 8B)
> эмоциональная речь (счастье, сердитая речь, грустная, шепот)
> открытые весы и работа с трансформерами/ vllm
https://huggingface.co/HKUSTAudio/Llasa-3B
> поддерживает клонирование голоса на английском и китайском языках
> обучен на 250 тысяч часов аудио
> модели 1B, 3B (скоро будет 8B)
> эмоциональная речь (счастье, сердитая речь, грустная, шепот)
> открытые весы и работа с трансформерами/ vllm
https://huggingface.co/HKUSTAudio/Llasa-3B
👍11❤2🔥1
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3👎2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
👩🍳🍽️ Pic2Cook
Мгновенно превращайте любую картинку с едой в подробный рецепт и список покупок.
Приложение написано на базе
MistralAI Pixtral 12B.
▪ Github
Мгновенно превращайте любую картинку с едой в подробный рецепт и список покупок.
Приложение написано на базе
MistralAI Pixtral 12B.
git clone https://github.com/sophiamyang/pic2cook.git
cd pic2cook
▪ Github
👍7🔥3❤2
Forwarded from Machinelearning
Разработчики с Hugging Face повторил полный цикл разработки DeepSeek - от сбора данных до обучения! 🔥
Цель этого репозитория - объяснить все части конвейера создания R1 таким образом, чтобы каждый мог повторить его или построить поверх него свой проект.
Из чего состоит проект:
- src/open_r1 содержит скрипты для обучения и оценки моделей, а также для генерации синтетических данных:
- grpo.py : обучение модели с помощью GRPO
- sft.py: простой SFT
- evaluate.py: оценка модели на основе тестов R1.
- generate.py: генерация синтетических данных с помощью Distilabel.
- Makefile содержит простую в выполнении команду для каждого шага конвейера R1.
▪ Github
@ai_machinelearning_big_data
#opensource #DeepSeekR1 #huggingface #OpenR1
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥26👍6❤3
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤3🔥1
Версия Qwen2.5-VL.
https://huggingface.co/collections/Qwen/qwen25-vl-6795ffac22b334a837c0f9a5
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2
Forwarded from Machinelearning
🐋 DeepSeek только что выпустила еще одну модель ИИ с открытым исходным кодом, Janus-Pro-7B.
Она мультимодальная и выигрывает у OpenAI DALL-E 3 и Stable Diffusion на бенчмарках GenEval и DPG-Bench.
▪Модели: https://huggingface.co/deepseek-ai/Janus-Pro-7B
https://huggingface.co/deepseek-ai/Janus-Pro-1B
▪Quickstart: https://github.com/deepseek-ai/Janus?tab=readme-ov-file#3-quick-start 📖
▪Tech report: https://github.com/deepseek-ai/Janus/blob/main/janus_pro_tech_report.pdf
@ai_machinelearning_big_data
#ai #deepseek #opensource #Janus
Она мультимодальная и выигрывает у OpenAI DALL-E 3 и Stable Diffusion на бенчмарках GenEval и DPG-Bench.
▪Модели: https://huggingface.co/deepseek-ai/Janus-Pro-7B
https://huggingface.co/deepseek-ai/Janus-Pro-1B
▪Quickstart: https://github.com/deepseek-ai/Janus?tab=readme-ov-file#3-quick-start 📖
▪Tech report: https://github.com/deepseek-ai/Janus/blob/main/janus_pro_tech_report.pdf
@ai_machinelearning_big_data
#ai #deepseek #opensource #Janus
🔥16👍6😁4
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍1
Forwarded from Machinelearning
⚡️NVIDIA выпустили Eagle 2 — 1B, 2B и 9B VLM.
Eagle 2 - это обновление семейство мощных vision language моделей.
Модель 9B превосходит GPT4o ChartQA, OCRBench и MathVista, а также Llama 3.2 Vision 90B и llava 70B 🔥
Может работать с длинным контекстом, поддерживает 4K, HD.
> Eagle2-9B превосходит InternVL2-8B и MiniCPM-v2.6 по всем 14 тестам
> Он превосходит Qwen2-VL-7B в 9 из 14 тестов и превосходит его в OpenCompass
> Конкурирует с более крупными моделями, такими как InternVL2-26B, LLaVa-OneVision-72B и LLaMa-3.2-90B-Vision
> Eagle2-9B превосходит GPT-4o на ChartQA, OCRBench и MathVista и близок к GPT-4o на DocVQA, MMStar, AI2D и OpenCompass
> В открытом доступе выложены модель и чекпоинты
🤗 Hf: https://huggingface.co/collections/nvidia/eagle-2-6764ba887fa1ef387f7df067
@ai_machinelearning_big_data
#eagle #nvidia #vision #ml #ai
Eagle 2 - это обновление семейство мощных vision language моделей.
Модель 9B превосходит GPT4o ChartQA, OCRBench и MathVista, а также Llama 3.2 Vision 90B и llava 70B 🔥
Может работать с длинным контекстом, поддерживает 4K, HD.
> Eagle2-9B превосходит InternVL2-8B и MiniCPM-v2.6 по всем 14 тестам
> Он превосходит Qwen2-VL-7B в 9 из 14 тестов и превосходит его в OpenCompass
> Конкурирует с более крупными моделями, такими как InternVL2-26B, LLaVa-OneVision-72B и LLaMa-3.2-90B-Vision
> Eagle2-9B превосходит GPT-4o на ChartQA, OCRBench и MathVista и близок к GPT-4o на DocVQA, MMStar, AI2D и OpenCompass
> В открытом доступе выложены модель и чекпоинты
@ai_machinelearning_big_data
#eagle #nvidia #vision #ml #ai
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥3👍1😁1
Forwarded from Machinelearning
⚡️ Hailuo AI выпустили новую версию своего генератора видео T2V 01 Director, в которой упор сделан на контроль камеры!
Модель управления и движения камеры работает просто великолепно.
✨ Что нового:
- Уменьшена хаотичность движений генераций.
- Повышена точность управления.
- Улучшена эстетика движения камеры.
📌 Попробовать
@ai_machinelearning_big_data
#video #ai #videogenerator #Hailuo
Модель управления и движения камеры работает просто великолепно.
✨ Что нового:
- Уменьшена хаотичность движений генераций.
- Повышена точность управления.
- Улучшена эстетика движения камеры.
📌 Попробовать
@ai_machinelearning_big_data
#video #ai #videogenerator #Hailuo
👍8❤3
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍2🔥1
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👎7👍4😁3❤2🥰1
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤1
🚀 Свежий 100% бесплатный API с дистиллированным DeepSeek-R1 Llama 70B.
Доступно на Together AI, они размещают эти модели в своих собственных центрах обработки данных, и никакие данные не отправляются обратно в DeepSeek.
Примечание: эндпоинт бесплатной модели имеет ограничения по скорости и производительности по сравнению с их платными режимами Turbo, тем не менее все работает.
https://api.together.ai/playground/chat/deepseek-ai/DeepSeek-R1-Distill-Llama-70B-free
@machinelearning_ru
Доступно на Together AI, они размещают эти модели в своих собственных центрах обработки данных, и никакие данные не отправляются обратно в DeepSeek.
Примечание: эндпоинт бесплатной модели имеет ограничения по скорости и производительности по сравнению с их платными режимами Turbo, тем не менее все работает.
https://api.together.ai/playground/chat/deepseek-ai/DeepSeek-R1-Distill-Llama-70B-free
@machinelearning_ru
🔥8👍4👎3❤1