BLOCKCHAINRF Telegram 10486
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision

Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг (CEO NVIDIA).

Ключевые особенности:

1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения.

2. Расширенные возможности:
- Контекстное окно в 128k токенов
- Обработка больших документов с чередующимся текстом и изображениями

3. Модель распространяется под лицензией Apache 2.0.

Производительность

Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках:

- Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA.
- Показывает высокие результаты в задачах, требующих точного выполнения инструкций.
- Демонстрирует сильные показатели в различных текстовых задачах.

Сравнение с конкурентами

В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision, особенно в мультимодальных задачах и задачах следования инструкциям.



tgoop.com/blockchainRF/10486
Create:
Last Update:

Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision

Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг (CEO NVIDIA).

Ключевые особенности:

1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения.

2. Расширенные возможности:
- Контекстное окно в 128k токенов
- Обработка больших документов с чередующимся текстом и изображениями

3. Модель распространяется под лицензией Apache 2.0.

Производительность

Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках:

- Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA.
- Показывает высокие результаты в задачах, требующих точного выполнения инструкций.
- Демонстрирует сильные показатели в различных текстовых задачах.

Сравнение с конкурентами

В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision, особенно в мультимодальных задачах и задачах следования инструкциям.

BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире







Share with your friend now:
tgoop.com/blockchainRF/10486

View MORE
Open in Telegram


Telegram News

Date: |

How to Create a Private or Public Channel on Telegram? A vandalised bank during the 2019 protest. File photo: May James/HKFP. Each account can create up to 10 public channels Telegram offers a powerful toolset that allows businesses to create and manage channels, groups, and bots to broadcast messages, engage in conversations, and offer reliable customer support via bots. The main design elements of your Telegram channel include a name, bio (brief description), and avatar. Your bio should be:
from us


Telegram Все о блокчейн/мозге/space/WEB 3.0 в России и мире
FROM American