Telegram Web
🔥 AgentScript — это фреймворк на TypeScript для создания надежных AI-агентов, которые "мыслят кодом"!

🌟 Основная идея заключается в том, чтобы использовать языковые модели (LLM) для генерации кодовых планов, которые затем выполняются в изолированной среде. Это позволяет автоматизировать сложные задачи с учетом последовательностей действий, взаимодействия с инструментами и возможности паузы выполнения.

🔐 Лицензия: ELv2

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
💰 Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget

Вышел официальный код и чекпоинты для MicroDiffusion от Sony.

Советую прочитать статью, в ней авторы подробно рассказывают о том, как они обучили модель уровня SD1 (MicroDiT) за $1890, используя диффузионный трансформер с MoE и наборы реальных+синтетических данных на 37M.

Теперь любой желающий может обучить модель Stable Diffusion v1/v2-уровня с нуля всего за 2,5 дня, используя 8 графических процессоров H100 (стоимостью < $2000)

Здесь можно посмотреть конфигурацию обучения для каждого этапа.

Paper: https://arxiv.org/abs/2407.15811v1
Github: https://github.com/SonyResearch/micro_diffusion
HF: https://huggingface.co/VSehwag24/MicroDiT
Dataset: https://github.com/SonyResearch/micro_diffusion/blob/main/micro_diffusion/datasets/README.md

@ai_machinelearning_big_data


#stablediffusion #guide #sd #ml #sony
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Можно ли масштабировать трансформаторы до уровня AGI?

Илья Суцкевер: Очевидно, да

📌 Полное видео
🚀 LlamaV-o1: Мультимодальная модель рассуждений с открытым исходным кодом! 🌟

Рассуждение с обучением и масштабированием во время тестирования
3,8% прироста по 6 бенчмаркам, 5× более быстрое масштабирование выводов, чем у Llava-CoT
Новый VRC-Bench для мультимодальных рассуждений

🔗 https://mbzuai-oryx.github.io/LlamaV-o1/

@machinelearning_ru
This media is not supported in your browser
VIEW IN TELEGRAM
🎓 stable point-aware 3D от Stability AI

Свежий опенсорс инструмент, который отлично справляется с созданием 3D объектов по одному изображению.

Работает так - диффузионная модель генерирует облако точек, после чего трансформер обрабатывает его совместно с исходным изображением, восстанавливая геометрию объекта, текстуры и освещение.

Вы можете редактировать облако точек различными способами: удалять, дублировать, растягивать, добавлять новые элементы или изменять цвета отдельных точек.

HF: https://huggingface.co/spaces/stabilityai/stable-point-aware-3d
Github: https://github.com/Stability-AI/stable-point-aware-3d
Forwarded from Machinelearning
🔥 Вышла новая модель MiniMax-01 456B с открытым исходным кодом с контекстом 4M !

🚀 Функции MiniMax-Text-01 и MiniMax-VL-01 основаны на ультрасовременной архитектуре "Lightning Attention".

→ В MiniMax-Text-01 реализован гибридный подход, при котором в 7 из каждых 8 слоев используется Lightning Attention, а в одном - SoftMax для улучшения баланса модель.

Такая архитектура позволяет эффективно обрабатывать сверхдлинные последовательности.

→ Версия с открытым исходным кодом включает в себя полный набор весов и API. По цене примерно 0,2 доллара за миллион входных токенов и 1,1 доллара за миллион выходных токенов — вполне конкурентоспособные цены.

На тестах модель превосходит платный Deep Seek v3 ! 💥

→ В задачах с длинным контекстом MiniMax-Text-01 достиг 100% точности в тесте поиска "Needle-in-a-Haystack" с использованием 4 миллионов токенов, превосходя топовые модели в реальных задачах с использованием искусственного интеллекта.

🖥 Github: https://github.com/MiniMax-AI/MiniMax-01
📑Paper:https://filecdn.minimax.chat/_Arxiv_MiniMax_01_Report.pdf
📖Read more: https://minimaxi.com/en/news/minimax-01-series-2

@ai_machinelearning_big_data

#llm #MiniMax #ai #agents #ml #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 Cline — автономный помощник по программированию, интегрированный непосредственно в вашу среду разработки (IDE)!

💡 Cline способен создавать и редактировать файлы, выполнять команды в терминале, использовать браузер и многое другое, получая ваше разрешение на каждом этапе.

🌟 Интегрируясь с моделями OpenAI, Google и Anthropic, Cline может пошагово выполнять сложные задачи разработки ПО. Он анализирует структуру файлов и абстрактные синтаксические деревья (AST) вашего проекта, выполняет регулярные выражения и читает соответствующие файлы, чтобы эффективно интегрироваться в существующие проекты.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🥁🎷JASCO 🎶🪇 training & inference code + model weights are out!

JASCO состоит из модели для токенизации звука и модели согласования потоков, основанной на архитектуре transformer для музыкального моделирования.

Модель представлена в 2х размерах: 400 м и 1B; и в настоящее время имеет два варианта управления: text-to-music + {аккорды, ударные} и text-to-music + {аккорды, ударные, мелодия}.

Сатья📜: https://arxiv.org/abs/2406.10970
Примеры🔊: https://pages.cs.huji.ac.il/adiyoss-lab/JASCO/
Код🐍: https://github.com/facebookresearch/audiocraft/blob/main/docs/JASCO.md
Модели🤗: https://huggingface.co/facebook/jasco-chords-drums-melody-1B

@machinelearning_ru
🔥 Agentarium — это мощный фреймворк на Python для создания и управления симуляциями с ИИ-агентами!

🌟 Он предоставляет интуитивную платформу для разработки сложных и интерактивных сред, где агенты могут действовать, обучаться и развиваться.

🌟 Фреймворк поддерживает управление агентами, взаимодействие между ними, создание синтетических данных через их действия и сохранение состояния с помощью контрольных точек. Agentarium оптимизирован для производительности и масштабируемости, а также предлагает гибкую конфигурацию окружения через YAML.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/02/04 09:14:02
Back to Top
HTML Embed Code: