Big Data AI 772 - Telegram Web

Forwarded from Machinelearning

🌟 Meta-Llama-3.1-405B-Instruct-FP8: FP8-версии Llama-3.1-405B-Instruct со статическим и динамическим методом квантования.

Компания Neural Magic представила две квантованные FP8-версии модели Meta's Llama 3.1 405B Instruct:

🟢

Meta-Llama-3.1-405B-Instruct-FP8-dynamic

🟢

Meta-Llama-3.1-405B-Instruct-FP8

Примененная оптимизация уменьшает количество бит на параметр с 16 до 8, сокращая требования к VRAM примерно на 50 %. FP8-модель может быть развернута помощью одного узла 8xH100 GPU.

Процесс квантования применялся исключительно к весам и активациям линейных операторов внутри блоков трансформеров. Использовалось симметричное поканальное квантование, которое включает линейное масштабирование по выходному измерению для отображения представлений FP8 квантованных весов и активаций.
Кроме того, активации квантованы динамически на основе каждого токена.
Для квантования использовалась библиотека оптимизации LLM Compressor с набором 512 последовательностей UltraChat.

Обе FP8 модели сохраняют архитектуру Meta-Llama-3.1 и могут быть запущены на бэкенде vLLM.

В бенчмарке OpenLLM версия FP8-dynamic получила средний балл 86,55. Это максимально близко к результату оригинальной модели - 86,63 (99,91%).

🟡

Модель FP8-dynamic на HF

🟡

Модель FP8 на HF

@ai_machinelearning_big_data

#AI #ML #LLM #Llama #FP8

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤1

2.66K views12:44

✨ На платформе LLM Arena была обнаружена новая модель Яндекса YandexGPT Experimental

Эта модель, которая станет частью обновленного семейства YandexGPT, уже делит лидерство в рейтинге с такими крупными игроками, как GPT-4o, GPT-4 Turbo и Claude 3,5 Sonnet. Яндекс подтвердил, что работает над улучшением своей языковой модели, и обещает значительное повышение её возможностей.

LLM Arena, созданная независимыми разработчиками из российского ML-комьюнити, предоставляет пользователям возможность сравнивать ответы различных нейросетей на русском языке. Пользователи могут задавать любые вопросы и объективно оценивать качество ответов благодаря обезличенному формату.

@bigdatai

❤6👍2🔥1🤮1

2.94K views16:18

👩‍💻

torchchat - мощный инструмент для инференса LLM

Легкая и удобная библиотека для локального запуска Lms на мобильных устройствах, настольных компьютерах и ноутбуках на базе PyTorch.

▪Github
▪ Blog

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍2🔥1

3.06K views12:43

🔝 Caldera

Набор данных Caldera представляет собой сцены с открытым исходным кодом, содержащую большую часть геометрии, найденной в игре Call of Duty®: Warzone™. Это не фактические производственные данные, а скорее преобразование их частей в формат файла USD с открытым исходным кодом.

▪ Github

@bigdatai

👍6❤2🔥2

2.92K views07:59

🌟 Инновации в мире данных: Новый инструмент от GitHub

GitHub вновь удивляет! Представлен новый инструмент для машинного обучения — Models. Эта платформа уже сравнивается с Hugging Face и обещает стать незаменимым помощником для разработчиков.

🔍 Проект пока на стадии тестирования, но вы можете записаться в лист ожидания и быть в числе первых, кто опробует его возможности. Важные особенности GitHub Models:

Тестирование нейронных сетей в безопасной песочнице перед интеграцией кода в VS Code или Codespaces.

Интеграция с Azure и другими популярными облачными сервисами для разработчиков.

🧠 Уже сейчас на платформе доступно более 20 моделей, включая GPT-4o, GPT-4o mini и Llama 3.1. Платформа будет регулярно обновляться, а разработчики смогут добавлять свои собственные модели, расширяя библиотеку.

📘 GitHub

Оставайтесь на волне инноваций и готовьтесь к собеседованиям с последними новостями и инструментами! 🔥💻

@bigdatai

The GitHub Blog

Introducing GitHub Models: A new generation of AI engineers building on GitHub

We are enabling the rise of the AI engineer with GitHub Models – bringing the power of industry leading large and small language models to our more than 100 million users directly on GitHub.

❤1👍1

2.76K views11:04

This media is not supported in your browser

VIEW IN TELEGRAM

🤖

LSP-AI

Интересный инструмент с открытым исходным кодом, позволяющий обсуждать ваш код с ИИ, над которым работаете, без переключения контекста.

Общайтесь с LLM прямо в текстовом редакторе

Работает с любым LSP-совместимым редактором (VS Code, Neovim, Helix, Emacs и т.д.)

Поддерживает различные локальные Lms, используя llama.cpp, Ollama, любой сервер, совместимый с OpenAPI, и многое другое.

▪ Github

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥5👍5❤3

2.58K viewsedited 09:00

🧠 NeuroSynth — набор данных для нейросетевых исследований в области синтетических изображений

NeuroSynth представляет собой обширный набор данных, предназначенный для обучения и тестирования нейросетевых моделей на синтетических изображениях.

Этот набор данных включает в себя разнообразные сценарии и объекты, созданные с помощью генеративных алгоритмов, что позволяет исследователям и разработчикам улучшать и адаптировать свои модели для работы с синтетическими данными.

Основные характеристики NeuroSynth:

Широкий выбор сцен и объектов: Набор данных охватывает множество различных сцен и объектов, которые можно использовать для тренировки моделей в различных областях, таких как компьютерное зрение и генерация изображений.

Высокое качество данных: Изображения в наборе данных имеют высокое разрешение и детализированную текстуру, что позволяет моделям эффективно обучаться на реалистичных данных.

Открытый доступ: NeuroSynth доступен для исследователей и разработчиков, что способствует развитию новых технологий и улучшению существующих алгоритмов.

Пример использования NeuroSynth:

from neuro_synth import DataLoader

# Загрузка набора данных
data_loader = DataLoader('path/to/neuro_synth')
images = data_loader.load_images()

# Обработка и тренировка модели
model.train(images)

Исследуйте возможности NeuroSynth и улучшайте свои модели с помощью синтетических данных!

▪ GitHub

@bigdatai

👍5❤2🔥2

2.47K views11:05

Forwarded from Machinelearning

🌟BRAG: Серия Instruct-RAG LLM.

BRAG - это серия специализированных языковых моделей, обученных для RAG-задач с текстом, таблицами и в режиме чата. Все модели ориентированы в основном на английский язык, но модели на базе Llama-3.1-8B и Qwen2-1.5b имеют наследованную поддержку мультиязычности.

В качестве базовых моделей использованы Qwen2-1.5B, Qwen2-7B-Instruct, Llama-3.1-8B-Instruct и Llama-3-8B-Instruct.

Список моделей:

🟢

BRAG-Qwen2-7b-v0.1 Instruct | 7B | 128K

🟢

BRAG-Llama-3.1-8b-v0.1 Instruct | 8B | 128K

🟢

BRAG-Llama-3-8b-v0.1 Instruct | 8B | 8K

🟢

BRAG-Qwen2-1.5b-v0.1 Instruct | 1.5B | 32K

▶️

Формат промта:


messages = [
    {"role": "system", "content": "You are an assistant who gives helpful, detailed, and polite answers to the user's questions based on the context with appropriate reasoning as required. Indicate when the answer cannot be found in the context."},
    {"role": "user", "content": """Context: <CONTEXT INFORMATION> \n\n <USER QUERY>"""},
]

⚡️Лицензирование : Apache-2.0

▪Страница проекта
▪Коллекция моделей на HF

@ai_machinelearning_big_data

#AI #LLM #ML #BRAG #RAG

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤2🔥2

2.84K views13:06

Forwarded from C++ Academy

🪐

Gravitational Lensing by Spinning Black Holes in Astrophysics, and in the Movie Interstellar

Невероятная статья, которую вы возможно пропустили.

Программное обеспечение для создания черной дыры в фильме "Интерстеллар" представляет собой полную реализацию уравнений Эйнштейна в 40 000 строк на C++, которое отрисовало тысячи 23-мегапиксельных кадров формата IMAX на 32 000-ядерной рендер-ферме со скоростью около 20 ядер в час на кадр .

Про реализацию этого монстра можно почитать здесь: https://arxiv.org/pdf/1502.03808.pdf

@cpluspluc

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥7🔥5🤩4

2.69K views08:57

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 UnpromptedControl

Unprompted Control — это утилита, которая автоматически удаляет объекты с изображений и восстанавливает поврежденные области, используя методы глубокого обучения и смешивания. В этом процессе ключевую роль играют модели Control Net и Stable Diffusion Inpaint Pipeline, которые направляют восстановление и обеспечивают естественное слияние результатов с остальным изображением.

Однако метод имеет свои ограничения, особенно при работе с изображениями лиц и тел людей. В таких случаях может потребоваться маскирование не только самого объекта, но и его теней для достижения наилучшего результата.

Несмотря на эти сложности, репозиторий предлагает ценный инструмент для бесшовного восстановления и удаления объектов.

- Githiub
- Colab

@bigdatai

👍7❤2🔥2

2.56K viewsedited 12:23

This media is not supported in your browser

VIEW IN TELEGRAM

🖥

Интерактивная схема устройства работы векторных баз данных

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10❤3🔥2

2.62K viewsedited 07:24

⚡️ Отличная статья, которая только что вышла из Stanford Med; "Нелинейная динамика многомерных факторов при старении человека"

самое интересное, что данные находятся в открытом доступе.

репо: https://github.com/jaspershen-lab/ipop_aging

довольно детальная информация

cтатья: https://nature.com/articles/s43587-024-00692-2

@bigdatai

❤8👍2🔥2

2.96K views10:03

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Создаем мощный детектор объектов с помощью Fastslam с
помощью ultralytics 🚀

🔗Код: https://docs.ultralytics.com/models/fast-sam/

💡 Здесь используется уменьшенная версия FASTSAM, которая позволяет обнаруживать объекты в режиме реального времени + для повышения производительности используется botsort функция.

#искусственныйинтеллект #отслеживаниеобъектов #sam2

@bigdatai

❤7👍2🔥2❤‍🔥1🥰1

2.5K views15:48

This media is not supported in your browser

VIEW IN TELEGRAM

🖥

open-interpreter инструмент управление компьютером с помощью естественного языка

Это Python-библиотека, которая позволяет управлять ПК с помощью обычной челочеческой речи, в том числе на русском. На видео переключаются со светлой темы на тёмную, конвертируют docx-файлы на рабочем столе в .pdf.

Репозиторий проекта
Интерактивная демка в Colab

#llm #библиотека

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9👍6🥰2🤔2

2.58K viewsedited 07:40

2025/07/13 10:36:35
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>