Telegram Web
Forwarded from Machinelearning
🌟 RLtools: самая быстрая библиотека глубокого обучения с подкреплением для задач непрерывного управления.

RLtools - библиотека глубокого обучения с подкреплением (Deep Reinforcement Learning, DRL) с высокой скоростью работы для разработки и исследования алгоритмов DL.

RLtools написана на C++ и позволяет проводить обучение и вывод моделей DRL на РС, мобильных устройствах и embedded-системах. В экспериментальном тестировании, библиотека обучила алгоритм RL непосредственно на микроконтроллере.

Библиотека поддерживает алгоритмы DRL: TD3, PPO, Multi-Agent PPO и SAC и предлагает набор примеров, демонстрирующих использование этих алгоритмов для решения задач управления на примерах управления маятником, гоночным автомобилем и роботом-муравьем MuJoCo.

Код реализации алгоритмов:

🟢TD3 - Pendulum, Racing Car, MuJoCo Ant-v4, Acrobot;
🟢PPO - Pendulum, Racing Car, MuJoCo Ant-v4 (CPU), MuJoCo Ant-v4 (CUDA);
🟢Multi-Agent PPO - Bottleneck;
🟢SAC - Pendulum (CPU), Pendulum (CUDA), Acrobot.

Благодаря оптимизации и использования аппаратного ускорения RLtools в 76 раз быстрее других библиотек. Например, на MacBook Pro с M1 RLtools может обучить модель SAC (управление маятником) за 4 секунды.

Библиотеку можно использовать на Linux, macOS, Windows, iOS, Teensy, Crazyflie, ESP32 и PX4.

RLtools предоставляет Python API, с которым можно использовать библиотеку из Python-кода. API RLtools совместим с библиотекой симуляции сред Gym.

Проекты, использующие RLtools:

🟠Научиться летать за секунды (Youtube, IEEE Spectrum);

🟠Идентификация системы на основе данных для квадрокоптеров с задержкой двигателя (Youtube, Project Page).

▶️Запуск на примере обучения политике с помощью PPO:

# Clone and checkout
git clone https://github.com/rl-tools/example
cd example
git submodule update --init external/rl_tools

# Build and run
mkdir build
cd build
cmake .. -DCMAKE_BUILD_TYPE=Release
cmake --build .
./my_pendulum


📌Лицензирование: MIT License.


🟡Документация
🟡Arxiv
🟡RLTools Design Studio
🟡Demo
🟡Zoo Experiment Tracking
🟡Google Collab (Python Interface)
🟡Сообщество в Discord
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #DL #RTools #Github
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍3
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ StableV2V - это новая опенсорс модель с открытым исходным кодом, которая может для редактирования генерации видео

Вы можете использовать текстовые проптмы или изображения для редактирования видеоклипов.

И да, код и модель уже доступны.

Проект: https://alonzoleeeooo.github.io/StableV2V
Код: https://github.com/AlonzoLeeeooo/StableV2V
Модель: https://huggingface.co/AlonzoLeeeooo/StableV2V
👍21👎1🔥1🤬1
👩‍💻 nilearn — это библиотека на Python, ориентированная на нейровизуализацию и анализ данных с использованием машинного обучения!

🌟 Nilearn предоставляет инструменты для работы с данными функциональной и структурной МРТ, а также упрощает загрузку, визуализацию и анализ нейровизуальных данных. Основные функции библиотеки включают предобработку данных, извлечение временных рядов и обучение моделям машинного обучения для нейронаучных исследований.

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥1🤔1
📝 PDF-Extract-Kit — библиотека для извлечения данных из PDF-файлов с поддержкой сложных документов с помощью моделей компьютерного зрения!

🔍 Основные особенности:

🌟 Точное извлечение текста и таблиц из структурированных и неструктурированных PDF, включая многостраничные таблицы и иерархические блоки!

🌟 OCR-интеграция, позволяющая обрабатывать PDF-документы с отсканированными изображениями!

🌟 Гибкий API на Python, что делает его удобным для анализа и интеграции в приложения!

🔐 Лицензия: AGPL-3.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥4👍3🥰1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Material Anything

Новая модель диффузии , которая может генерировать фотореалистичные PBR-материалы для любых 3D-сеток (сгенерированный или реальных).
Проект: https://xhuangcv.github.io/MaterialAnything/
Обсуждение: https://huggingface.co/papers/2411.15138

@machinelearning_ru
👎2
🔥 codecompanion.nvim — это плагин для Neovim, предназначенный для интеграции с LLM!

🌟 Он предоставляет возможности взаимодействия с LLM прямо из редактора, позволяя выполнять различные задачи, такие как автодополнение кода, рефакторинг, генерация документации и многое другое.

🔍 Ключевые возможности плагина:

🌟 Использование интерфейса чата для взаимодействия с языковой моделью.

🌟 Выполнение задач через специальные инструменты (Tools), которые могут работать либо как команды, исполняющиеся в фоновом режиме, либо как функции, запускаемые прямо в процессе Neovim.

🌟 Настраиваемые подсказки и сценарии, упрощающие разработку, тестирование и управление кодом.

🔐 Лицензия: MIT

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🤯2🔥1
⚡️ Эндрю Нг, основатель DeepLearningAI и Coursera только что выпустил новый пакет Python с открытым исходным кодом.

Быстрая смена моделей через простой строковый идентификатор. Гибкая и простая в использовании и библиотека.

Одна строка для переключения между любыми LLM:
OpenAI ➝ "openai:gpt-4o"
Claude ➝ "антропный:claude-3-5-sonnet"
Лама ➝ "оллама:ллама3"

pip install aisuite

GitHub: https://github.com/andrewyng/aisuite
🔥11👍42👎2😁2🤬1
Как сэкономить до 44% на профессиональных GPU? 💰

Профессиональные GPU стоят дорого и покупать их не всегда выгодно. Например, если вам нужно протестировать сервис или выполнить краткосрочную задачу.

Оптимальное решение — арендовать видеокарту в облаке. Тем более сейчас в Selectel вы можете сделать это с большой выгодой. Скидка на аренду GPU NVIDIA A100 (40 ГБ) — 29%, а на NVIDIA A30 (24 ГБ) доходит до 44%.

Кроме скидки, при аренде GPU в облаке Selectel вы получаете:

🔹Отсутствие переплат и тарификацию только за используемые ресурсы
🔹Экономию на инфраструктуре благодаря прерываемым облачным серверам и возможности заморозки ресурсов
🔹Широкий выбор готовых конфигураций серверов под любые задачи и возможность индивидуальной настройки

Арендуйте GPU со скидкой до 44% в облаке Selectel: https://slc.tl/k7249

Реклама, АО «Селектел», ИНН: 7810962785, ERID: 2VtzqwNnQBh
Please open Telegram to view this post
VIEW IN TELEGRAM
1
🔥 Arch — это интеллектуальный распределенный прокси-сервер уровня 7 , предназначенный для защиты, наблюдения и персонализации ваших ИИ агентов!

🌟 Созданный с использованием специально разработанных LLM, Arch решает критически важные, но недифференцированные задачи, связанные с обработкой и запросами, включая обнаружение и отклонение попыток взлома, интеллектуальный вызов «бэкэнда» API для выполнения запроса пользователя, представленного в запросе, маршрутизацию к вышестоящим LLM и предложение аварийного восстановления между ними, а также централизованное управление наблюдаемостью запросов и взаимодействиями LLM.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1🔥1
🔥 nano-graphrag — библиотека для работы с Retrieval-Augmented Generation (RAG), упрощающая интеграцию графовых баз данных, таких как Neo4j, для поиска и обработки контекстных данных!

🌟 Она используется для построения эффективных систем поиска и извлечения информации с помощью графов, что актуально в задачах, связанных с естественным языком и большими языковыми моделями.

🌟 Библиотека позволяет загружать данные в графовые базы, выполнять разбиение текста на фрагменты, а также поддерживает модули для обработки запросов и работы с графами. Она интегрируется с Neo4j, используя их Graph Data Science (GDS) плагины для вычислений, что делает её подходящей для анализа сложных сетевых структур.

🔐 Лицензия: MIT

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2👍1
👀 Я просто оставлю этот вывод Copilot здесь...

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
😁18👍21🥰1😱1🤩1
🔍 veRL — это гибкая, эффективная и промышленная среда обучения с подкреплением (RL), разработанная для больших языковых моделей (LLM)!

💡 Обучение с подкреплением — это тип машинного обучения, в котором агент обучается принимать решения, взаимодействуя с окружающей средой, чтобы максимизировать награду. Агент выбирает действия, исходя из текущего состояния среды, и получает обратную связь в виде награды или штрафа. Основной задачей является улучшение стратегии (политики), чтобы в будущем принимать более эффективные решения. Это используется в таких областях, как игры (например, AlphaGo), робототехника, автономные системы и оптимизация процессов.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥1
📖 Человек и LLM: как построить метрики для оценки моделей

💡 Оценка качества ответов языковой модели требует сложного комплексного подхода и является такой же сложной задачей, как и разработка LLM. Авторы статьи объясняют ограничения академических бенчмарков, включая проблему протечек данных и ограниченность их проверки, а также рассказывают про систему AI-тренеров в Яндексе — специально отобранных экспертов для глубокой оценки ответов модели.

🌟 Как оказалось, универсального решения для оценки LLM нет, необходимо постоянно комбинировать различные методы и регулярно проверять, насколько модель действительно полезна в реальных сценариях использования. В статье подробнее раскрывается, как это делают в Яндексе.

📖 Читать: *клик*

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54🔥4
2025/07/14 10:36:27
Back to Top
HTML Embed Code: