tgoop.com/pashaaiaiai/170
Last Update:
Новая LLM от Nvidia, заточенная под логические задачи
Компания опубликовала опенсорсную модель с длинным названием Llama 3.1-Nemotron-70B-Instruct.
Как можно догадаться, это не стопроцентная разработка Nvidia, а дообученная версия языковой модели Llama 3.1. Для обучения использовался метод RLHF — то есть обучение с подкреплением на основе фидбека пользователя.
LLM заточена под выполнение сложных задач и генерацию развернутых подробных ответов. В этом ей помогает контекстное окно в 128к токенов.
Разработчики считают, что модель отлично подойдет для чат-ботов, создания подробных текстовых подсказок для генерации различного контента, решения логических и математических задач.
В бенчмарках опенсорсный Nemotron показывает результаты, которые сопоставимы с топовыми проприетарными моделями, такими как Claude 3.5, GPT-4o и Gemini 1.5.
Потестировать LLM можно здесь.
Пользователи отмечают, что модель действительно классно справляется с задачами на логику, особенно с применением техники Chain of Thought. Те, кто уже попробовал модель, также предупреждают, что Nemotron не обучен для написания программного кода, так что в этой области чудес от LLM ждать не стоит.
В конце сентября Nvidia выпустила еще одну языковую модель из семейства Nemotron — Llama-3.1-Nemotron-51B. Эта модель была сбалансирована для получения максимально точных ответов при минимальной загрузке системы. Nemotron-51B для работы достаточно одного GPU H100 от Nvidia.
BY Паша AI AI AI

Share with your friend now:
tgoop.com/pashaaiaiai/170