SCRIPTRUNAI_MEDIA Telegram 8807
Meta FAIR представила 5 новых проектов для создания "человеко-подобного" ИИ

Исследовательская команда FAIR от Meta сделала крупный шаг к продвинутому ИИ — представлено сразу 5 новых разработок, направленных на восприятие, понимание и взаимодействие ИИ с окружающим миром.

Вот кратко о каждом из них:

Perception Encoder
Новый визуальный энкодер, способный точно распознавать сложные объекты на изображениях и видео — от ската, зарытого в песке, до птицы на заднем плане. Также усиливает возможности LLM в задачах, где важна визуальная логика: подписи, VQA, пространственные отношения и т.д.

Perception Language Model (PLM)
Открытая мульти-модальная модель (1B, 3B, 8B параметров) для точного визуального понимания. Meta также выпустила крупнейший датасет и бенчмарк для видео: PLM-VideoBench, включая 2.5M новых аннотированных примеров.

Meta Locate 3D

Модель, которая позволяет роботам находить объекты в 3D-пространстве по описанию на естественном языке. Например: «ваза у телевизора». Работает напрямую с 3D-точками от RGB-D сенсоров. Добавлен новый датасет с 130K аннотациями — в 2 раза больше, чем раньше было в открытом доступе.

Dynamic Byte Latent Transformer
Модель, работающая на уровне байтов, а не токенов. Устойчивее к ошибкам, нестандартным словам и «вредным» входам. Показывает рост точности до +55% на отдельных задачах по сравнению с традиционными LLM. Meta открыла веса и код.

Collaborative Reasoner
Фреймворк и модель для ИИ, умеющего сотрудничать с людьми и другими ИИ. Разговоры с множеством итераций, аргументацией, компромиссами и даже самотренировкой на синтетических диалогах. На задачах из математики, науки и логики показан рост эффективности до +29.4%.

💡 Все проекты доступны в открытом доступе: Meta снова делает ставку на фундаментальные ИИ-разработки, стремясь построить системы, ближе к человеческому восприятию и мышлению.
👍4



tgoop.com/scriptRunAI_media/8807
Create:
Last Update:

Meta FAIR представила 5 новых проектов для создания "человеко-подобного" ИИ

Исследовательская команда FAIR от Meta сделала крупный шаг к продвинутому ИИ — представлено сразу 5 новых разработок, направленных на восприятие, понимание и взаимодействие ИИ с окружающим миром.

Вот кратко о каждом из них:

Perception Encoder
Новый визуальный энкодер, способный точно распознавать сложные объекты на изображениях и видео — от ската, зарытого в песке, до птицы на заднем плане. Также усиливает возможности LLM в задачах, где важна визуальная логика: подписи, VQA, пространственные отношения и т.д.

Perception Language Model (PLM)
Открытая мульти-модальная модель (1B, 3B, 8B параметров) для точного визуального понимания. Meta также выпустила крупнейший датасет и бенчмарк для видео: PLM-VideoBench, включая 2.5M новых аннотированных примеров.

Meta Locate 3D

Модель, которая позволяет роботам находить объекты в 3D-пространстве по описанию на естественном языке. Например: «ваза у телевизора». Работает напрямую с 3D-точками от RGB-D сенсоров. Добавлен новый датасет с 130K аннотациями — в 2 раза больше, чем раньше было в открытом доступе.

Dynamic Byte Latent Transformer
Модель, работающая на уровне байтов, а не токенов. Устойчивее к ошибкам, нестандартным словам и «вредным» входам. Показывает рост точности до +55% на отдельных задачах по сравнению с традиционными LLM. Meta открыла веса и код.

Collaborative Reasoner
Фреймворк и модель для ИИ, умеющего сотрудничать с людьми и другими ИИ. Разговоры с множеством итераций, аргументацией, компромиссами и даже самотренировкой на синтетических диалогах. На задачах из математики, науки и логики показан рост эффективности до +29.4%.

💡 Все проекты доступны в открытом доступе: Meta снова делает ставку на фундаментальные ИИ-разработки, стремясь построить системы, ближе к человеческому восприятию и мышлению.

BY scriptRun AI медиа




Share with your friend now:
tgoop.com/scriptRunAI_media/8807

View MORE
Open in Telegram


Telegram News

Date: |

There have been several contributions to the group with members posting voice notes of screaming, yelling, groaning, and wailing in different rhythms and pitches. Calling out the “degenerate” community or the crypto obsessives that engage in high-risk trading, Co-founder of NFT renting protocol Rentable World emiliano.eth shared this group on his Twitter. He wrote: “hey degen, are you stressed? Just let it out all out. Voice only tg channel for screaming”. 6How to manage your Telegram channel? Judge Hui described Ng as inciting others to “commit a massacre” with three posts teaching people to make “toxic chlorine gas bombs,” target police stations, police quarters and the city’s metro stations. This offence was “rather serious,” the court said. Telegram iOS app: In the “Chats” tab, click the new message icon in the right upper corner. Select “New Channel.” As five out of seven counts were serious, Hui sentenced Ng to six years and six months in jail.
from us


Telegram scriptRun AI медиа
FROM American