@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
💰 Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget
Вышел официальный код и чекпоинты для MicroDiffusion от Sony.
Советую прочитать статью, в ней авторы подробно рассказывают о том, как они обучили модель уровня SD1 (MicroDiT) за $1890, используя диффузионный трансформер с MoE и наборы реальных+синтетических данных на 37M.
Теперь любой желающий может обучить модель Stable Diffusion v1/v2-уровня с нуля всего за 2,5 дня, используя 8 графических процессоров H100 (стоимостью < $2000)
Здесь можно посмотреть конфигурацию обучения для каждого этапа.
▪Paper: https://arxiv.org/abs/2407.15811v1
▪Github: https://github.com/SonyResearch/micro_diffusion
▪HF: https://huggingface.co/VSehwag24/MicroDiT
▪Dataset: https://github.com/SonyResearch/micro_diffusion/blob/main/micro_diffusion/datasets/README.md
@ai_machinelearning_big_data
#stablediffusion #guide #sd #ml #sony
Вышел официальный код и чекпоинты для MicroDiffusion от Sony.
Советую прочитать статью, в ней авторы подробно рассказывают о том, как они обучили модель уровня SD1 (MicroDiT) за $1890, используя диффузионный трансформер с MoE и наборы реальных+синтетических данных на 37M.
Теперь любой желающий может обучить модель Stable Diffusion v1/v2-уровня с нуля всего за 2,5 дня, используя 8 графических процессоров H100 (стоимостью < $2000)
Здесь можно посмотреть конфигурацию обучения для каждого этапа.
▪Paper: https://arxiv.org/abs/2407.15811v1
▪Github: https://github.com/SonyResearch/micro_diffusion
▪HF: https://huggingface.co/VSehwag24/MicroDiT
▪Dataset: https://github.com/SonyResearch/micro_diffusion/blob/main/micro_diffusion/datasets/README.md
@ai_machinelearning_big_data
#stablediffusion #guide #sd #ml #sony
🚀 LlamaV-o1: Мультимодальная модель рассуждений с открытым исходным кодом! 🌟 ✅
✅ Рассуждение с обучением и масштабированием во время тестирования
✅ 3,8% прироста по 6 бенчмаркам, 5× более быстрое масштабирование выводов, чем у Llava-CoT
✅ Новый VRC-Bench для мультимодальных рассуждений
🔗 https://mbzuai-oryx.github.io/LlamaV-o1/
@machinelearning_ru
✅ Рассуждение с обучением и масштабированием во время тестирования
✅ 3,8% прироста по 6 бенчмаркам, 5× более быстрое масштабирование выводов, чем у Llava-CoT
✅ Новый VRC-Bench для мультимодальных рассуждений
🔗 https://mbzuai-oryx.github.io/LlamaV-o1/
@machinelearning_ru
This media is not supported in your browser
VIEW IN TELEGRAM
🎓 stable point-aware 3D от Stability AI
Свежий опенсорс инструмент, который отлично справляется с созданием 3D объектов по одному изображению.
Работает так - диффузионная модель генерирует облако точек, после чего трансформер обрабатывает его совместно с исходным изображением, восстанавливая геометрию объекта, текстуры и освещение.
Вы можете редактировать облако точек различными способами: удалять, дублировать, растягивать, добавлять новые элементы или изменять цвета отдельных точек.
▪ HF: https://huggingface.co/spaces/stabilityai/stable-point-aware-3d
▪Github: https://github.com/Stability-AI/stable-point-aware-3d
Свежий опенсорс инструмент, который отлично справляется с созданием 3D объектов по одному изображению.
Работает так - диффузионная модель генерирует облако точек, после чего трансформер обрабатывает его совместно с исходным изображением, восстанавливая геометрию объекта, текстуры и освещение.
Вы можете редактировать облако точек различными способами: удалять, дублировать, растягивать, добавлять новые элементы или изменять цвета отдельных точек.
▪ HF: https://huggingface.co/spaces/stabilityai/stable-point-aware-3d
▪Github: https://github.com/Stability-AI/stable-point-aware-3d
Forwarded from Machinelearning
🚀 Функции MiniMax-Text-01 и MiniMax-VL-01 основаны на ультрасовременной архитектуре "Lightning Attention".
→ В MiniMax-Text-01 реализован гибридный подход, при котором в 7 из каждых 8 слоев используется Lightning Attention, а в одном - SoftMax для улучшения баланса модель.
Такая архитектура позволяет эффективно обрабатывать сверхдлинные последовательности.
→ Версия с открытым исходным кодом включает в себя полный набор весов и API. По цене примерно 0,2 доллара за миллион входных токенов и 1,1 доллара за миллион выходных токенов — вполне конкурентоспособные цены.
На тестах модель превосходит платный Deep Seek v3 ! 💥
→ В задачах с длинным контекстом MiniMax-Text-01 достиг 100% точности в тесте поиска "Needle-in-a-Haystack" с использованием 4 миллионов токенов, превосходя топовые модели в реальных задачах с использованием искусственного интеллекта.
📑Paper:https://filecdn.minimax.chat/_Arxiv_MiniMax_01_Report.pdf
📖Read more: https://minimaxi.com/en/news/minimax-01-series-2
@ai_machinelearning_big_data
#llm #MiniMax #ai #agents #ml #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🥁🎷JASCO 🎶🪇 training & inference code + model weights are out!
JASCO состоит из модели для токенизации звука и модели согласования потоков, основанной на архитектуре transformer для музыкального моделирования.
Модель представлена в 2х размерах: 400 м и 1B; и в настоящее время имеет два варианта управления: text-to-music + {аккорды, ударные} и text-to-music + {аккорды, ударные, мелодия}.
▪Сатья📜: https://arxiv.org/abs/2406.10970
▪Примеры🔊: https://pages.cs.huji.ac.il/adiyoss-lab/JASCO/
▪Код🐍: https://github.com/facebookresearch/audiocraft/blob/main/docs/JASCO.md
▪Модели🤗: https://huggingface.co/facebook/jasco-chords-drums-melody-1B
@machinelearning_ru
JASCO состоит из модели для токенизации звука и модели согласования потоков, основанной на архитектуре transformer для музыкального моделирования.
Модель представлена в 2х размерах: 400 м и 1B; и в настоящее время имеет два варианта управления: text-to-music + {аккорды, ударные} и text-to-music + {аккорды, ударные, мелодия}.
▪Сатья📜: https://arxiv.org/abs/2406.10970
▪Примеры🔊: https://pages.cs.huji.ac.il/adiyoss-lab/JASCO/
▪Код🐍: https://github.com/facebookresearch/audiocraft/blob/main/docs/JASCO.md
▪Модели🤗: https://huggingface.co/facebook/jasco-chords-drums-melody-1B
@machinelearning_ru
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM