PASHAAIAIAI Telegram 170
Новая LLM от Nvidia, заточенная под логические задачи

Компания опубликовала опенсорсную модель с длинным названием Llama 3.1-Nemotron-70B-Instruct. 

Как можно догадаться, это не стопроцентная разработка Nvidia, а дообученная версия языковой модели Llama 3.1. Для обучения использовался метод RLHF — то есть обучение с подкреплением на основе фидбека пользователя.

LLM заточена под выполнение сложных задач и генерацию развернутых подробных ответов. В этом ей помогает контекстное окно в 128к токенов.

Разработчики считают, что модель отлично подойдет для чат-ботов, создания подробных текстовых подсказок для генерации различного контента, решения логических и математических задач.

В бенчмарках опенсорсный Nemotron показывает результаты, которые сопоставимы с топовыми проприетарными моделями, такими как Claude 3.5, GPT-4o и Gemini 1.5.  

Потестировать LLM можно здесь.

Пользователи отмечают, что модель действительно классно справляется с задачами на логику, особенно с применением техники Chain of Thought. Те, кто уже попробовал модель, также предупреждают, что Nemotron не обучен для написания программного кода, так что в этой области чудес от LLM ждать не стоит.

В конце сентября Nvidia выпустила еще одну языковую модель из семейства Nemotron — Llama-3.1-Nemotron-51B. Эта модель была сбалансирована для получения максимально точных ответов при минимальной загрузке системы. Nemotron-51B для работы достаточно одного GPU H100 от Nvidia. 



tgoop.com/pashaaiaiai/170
Create:
Last Update:

Новая LLM от Nvidia, заточенная под логические задачи

Компания опубликовала опенсорсную модель с длинным названием Llama 3.1-Nemotron-70B-Instruct. 

Как можно догадаться, это не стопроцентная разработка Nvidia, а дообученная версия языковой модели Llama 3.1. Для обучения использовался метод RLHF — то есть обучение с подкреплением на основе фидбека пользователя.

LLM заточена под выполнение сложных задач и генерацию развернутых подробных ответов. В этом ей помогает контекстное окно в 128к токенов.

Разработчики считают, что модель отлично подойдет для чат-ботов, создания подробных текстовых подсказок для генерации различного контента, решения логических и математических задач.

В бенчмарках опенсорсный Nemotron показывает результаты, которые сопоставимы с топовыми проприетарными моделями, такими как Claude 3.5, GPT-4o и Gemini 1.5.  

Потестировать LLM можно здесь.

Пользователи отмечают, что модель действительно классно справляется с задачами на логику, особенно с применением техники Chain of Thought. Те, кто уже попробовал модель, также предупреждают, что Nemotron не обучен для написания программного кода, так что в этой области чудес от LLM ждать не стоит.

В конце сентября Nvidia выпустила еще одну языковую модель из семейства Nemotron — Llama-3.1-Nemotron-51B. Эта модель была сбалансирована для получения максимально точных ответов при минимальной загрузке системы. Nemotron-51B для работы достаточно одного GPU H100 от Nvidia. 

BY Паша AI AI AI




Share with your friend now:
tgoop.com/pashaaiaiai/170

View MORE
Open in Telegram


Telegram News

Date: |

How to Create a Private or Public Channel on Telegram? To view your bio, click the Menu icon and select “View channel info.” It’s yet another bloodbath on Satoshi Street. As of press time, Bitcoin (BTC) and the broader cryptocurrency market have corrected another 10 percent amid a massive sell-off. Ethereum (EHT) is down a staggering 15 percent moving close to $1,000, down more than 42 percent on the weekly chart. Joined by Telegram's representative in Brazil, Alan Campos, Perekopsky noted the platform was unable to cater to some of the TSE requests due to the company's operational setup. But Perekopsky added that these requests could be studied for future implementation. Public channels are public to the internet, regardless of whether or not they are subscribed. A public channel is displayed in search results and has a short address (link).
from us


Telegram Паша AI AI AI
FROM American