Агенты ИИ | AGI_and_RL 756 - Telegram Web

Агенты ИИ | AGI_and_RL

апаздал немножечко с форвардом... 😕 Но вдруг кому-то интересно, там в канале эфирчик

Please open Telegram to view this post

VIEW IN TELEGRAM

👌2

1.04K viewsedited 14:13

Агенты ИИ | AGI_and_RL

DARPA продолжает разработки по ИИ для Air Combat с истребителями. И вот они прошли важный рубеж.

ACE AI автономно управлял специально модифицированным F-16 (такая версия называется X-62A, или VISTA - Variable In-Flight Simulator Test Aircraft) при проведении боевых маневров против человека в воздушном бою.
Как понял, произошло это еще в сентябре 2023 на базе ВВС Эдвардс (Edwards Air Force Base) в Калифорнии.
При этом в X-62A также сидел пилот, но его вмешательства не потребовалось.

Сама программа ACE (Air Combat Evolution) стартовала в 2019 году.
Еще в 2020 были проведены испытания AlphaDogFight, в которых моделировались маневры в разных сценариях воздушного боя. Тогда ИИ-агент от компании Heron Systems доминировал над реальным опытным пилотом ВВС США «выигрывая со счетом 5:0 за счет агрессивных и точных маневров, которые пилот-человек не мог превзойти»

DARPA планирует продолжать эксперименты.

Такие дела... Страшно интересно.

Хотелось бы знать что там внутри. Использовали RL?

Посмотреть видосик от ДАРПЫ по поводу:
https://www.youtube.com/watch?v=C8yjtaZfNCw

Почитать https://thedebrief.org/darpas-groundbreaking-ace-program-and-x-62a-becomes-first-ai-controlled-jet-to-dogfight-against-manned-f-16-in-real-world/

DARPA ACE & USAF X-62A Achieve World First for AI in Aerospace

DARPA’s Air Combat Evolution (ACE) program has achieved the first-ever in-air tests of AI algorithms autonomously flying a fighter jet against a human-piloted fighter jet in within-visual-range combat scenarios (sometimes referred to as “dogfighting”).

In…

🔥6👍4👎3💩2😱1

1.72K views15:19

Агенты ИИ | AGI_and_RL

Forwarded from Derp Learning

Improving microbial phylogeny with citizen science within a mass-market video game

Наконец-то, статья, переплюнувшая статью Google Gemini по количеству контрибьюторов 😅

Если кратко - учёные, исследовавшие днк кишечной микрофлоры, запартнерились с gearbox и встроили в borderlands мини-игру, в которой игроки чинили реальные последовательности ДНК.

В итоге в мини-игру поиграло более 4 млн человек, решив 135 миллионов задач. Несложно прикинуть, сколько бы стоила обработка такого объема данных наемными людьми.
Вот это я понимаю краудсорсинг.

Образцы ДНК, кстати, были взяты из фекалий, чем можно объяснить повышенный интерес геймеров
/s

Пейпер

Improving microbial phylogeny with citizen science within a mass-market video game

Nature Biotechnology - Gamification of the multiple sequence alignment problem improves microbial phylogeny estimates.

🔥11👍3❤1

1.01K views20:57

Агенты ИИ | AGI_and_RL

Forwarded from Love. Death. Transformers.

Надеплоил llama3 70b, собираем синту под русские инструкт датасеты, приходите тыкаться!

@vikhrbot

👍7👌1

809 views14:39

Агенты ИИ | AGI_and_RL

Недавняя лекция-презентация от Яна ЛеКуна про Objective-Driven AI на 97 страничек

Про авторегрессионные модели (и их ограничения),
Energy-Based Models,
про Self-Supervised Learning,
World Models,
JEPA

https://drive.google.com/file/d/1Ymx_LCVzy7vZXalrVHPXjX9qbpd9k_bo/view

Видео: https://www.youtube.com/watch?v=MiqLoAZFRSE

👍8🤔4🔥2

1.31K viewsedited 11:14

Агенты ИИ | AGI_and_RL

Нашел на ютубе интервью с Ричардом Саттоном вышедшее пару месяцев назад.

https://www.youtube.com/watch?v=zZuh8YUBeDY

Ричард - один из создателей современного обучения с подкреплением и автор популярной книги "Reinforcement learning: An Introduction".

Статьи:
https://scholar.google.com/citations?hl=ru&user=6m4wv6gAAAAJ

На самом деле получилось достаточно базовое интервью, по 5 минуток пообсуждали планы Ричарда и разные ИИ-темы.

*Про то, что для ИИ важна цель;
*про The Alberta Plan;
*про коллабу с Кармаком;
ну и другие.

The Alberta Plan - это в общем-то реальный план по ресерчу и созданию агентов, "которые взаимодействуют с гораздо более сложным миром и способны предсказывать и контролировать свои сенсорные входные сигналы".
И там реально описана roadmap по созданию прототипа такого агента.
Выпустили его в 2022 году:

The Alberta Plan
https://arxiv.org/abs/2208.11173

Ричард Саттон и Джон Кармак заколлабились в 2023, для совместной работы над ИИ в Keen Technologies: https://www.amii.ca/latest-from-amii/john-carmack-and-rich-sutton-agi/

Richard Sutton on Pursuing AGI Through Reinforcement Learning

Join host Craig Smith on episode #170 of Eye on AI, for a riveting conversation with Richard Sutton, currently serving as a professor of computing science at the University of Alberta and a research scientist at Keen Technologies.

Sutton is considered one…

👍6🔥5😁2

1.76K viewsedited 17:13

Агенты ИИ | AGI_and_RL

DeepMindы подогнали интересную библиотеку для визуализации и анализа LLMок - Penzai

https://github.com/google-deepmind/penzai

Вроде как можно работать с архитектурой модельки, модифицировать уже натрейненые нейронки, визуализировать слои, ну и всякое interpretibility делать

Подготовлены несколько ноутбуков (для колаба и гегла) с примерами: https://github.com/google-deepmind/penzai/tree/main/notebooks

Все примеры пока крутятся вокруг работы с гугловой Gemma.

ну и доку читать надо: https://penzai.readthedocs.io/en/stable/index.html

👍9🔥5

1.57K viewsedited 19:11

Агенты ИИ | AGI_and_RL

Случайно наткнулся на прикольную либку, где авторы вкручивают разные механизмы для улучшения рассуждений с ллмками: реварды, поиск и в каком-то виде ворлд моделсы.
Не уверен, что это можно просто взять и использовать, но оно развивается и поразбирать отдельные механизмы можно.

Как понял из последних апдейтов туда и лламу 3 вкрутили.

https://www.llm-reasoners.net/

https://github.com/maitrix-org/llm-reasoners

И лидерборд ведут:
https://www.llm-reasoners.net/leaderboard

👍11

1.3K views09:40

Агенты ИИ | AGI_and_RL

Forwarded from Center for Cognitive Modeling

🎓 — Семинар 29. Curriculum Learning: выбор последовательности задач для обучения с подкреплением | Мария Нестерова

Завтра на семинаре выступит выпускница нашей магистерской программы МТИИ и ныне аспирантка нашего Центра, у которой уже 2 статьи на А*!

Если перед агентом стоит сложная задача, то для её освоения с нуля может потребоваться много времени. Один из способов решить эту проблему — рассмотреть сначала более простые задачи. Расписание обучения (Curriculum) позволяет автоматически выбрать задачи и определить порядок их изучения, что ускоряет процесс освоения сложных задач.

В первой части доклада будут рассмотрены существующие подходы к составлению расписания обучения. В рамках нашего исследования расписание обучения представлено в виде мета-агента, который выбирает задачи на основе анализа способностей обучающегося агента. Вторая часть доклада будет посвящена нашему методу и текущим результатам

📹 Трансляция Youtube

Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!

#семинары #RL

❤6👍3👏1

1.1K views14:05

Агенты ИИ | AGI_and_RL

Тут недавно статья выходила

Can Language Models Solve Olympiad Programming?
https://arxiv.org/abs/2404.10952v1

В работе авторы представили бенчмарк USACO из 307 задачек
https://princeton-nlp.github.io/USACOBench/

В GPT-4 в 0-shot с COT смогла решить 8.7% задачек.
После добавления self-reflection и retrieval поверх книги по олимп программированию https://cp-algorithms.com/ и базы решенных задачек GPT-4 смогла решить 20.2%.
❗️Под базой понимаются те же задачи и решения (с кодом) из USACO датасета, за исключением задачи, которая сейчас решается. (да, выглядит подозрительно, главное чтобы не было утечек).

Хотелось бы чтобы оно работало и для новых задачек, но это надо тестить.

Этот подход имплементнули для ленгчейна, которым многие пользуются, поэтому мб будет полезно: https://langchain-ai.github.io/langgraph/tutorials/usaco/usaco/

👍5🔥2

1.49K viewsedited 17:57

Агенты ИИ | AGI_and_RL

Forwarded from rizzearch

Offline Actor-Critic Reinforcement Learning Scales to Large Models

В основном ресерч в сфере рл происходит на маленьких моделях пушто
- и небольшие модели способны решить задачи при грамотном обучении и грамотной архитектуре (эмпирический факт), в основном это млп с релу/лики_релу и леернормой и все
- есть много проблем в сетапе рл, которые надо решать до того, как задумываешься о модельке и ее размерах
- если увеличивать размер модели, то это доп проблемы, потому что увеличиваются риски для нестабильности, вырожденности и всего такого

Но дипмаинд решил разнести и эту парадигму и отскейлить рл модели до больших размеров
Как оказывается, актор-критик в совокупности с perceiver'ом, который здесь может обрабатывать разные стейты для разных роботов (или симулякров роботов) + постепенно отходить от бихевиор клонинга, и выбивать высокий скор как на средах, где данные собраны хорошо, так и плохо!!

И это все на 132 тасках с непрерывными действиями🥸

👀LINK

#rl #offlinerl #multitask #behaviorcloning #largemodels #scalinglaws

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11👍3

1.71K views13:03

Агенты ИИ | AGI_and_RL

Интересный ресурс по RLю и оптимальному управлению от Dimitri P. Bertsekas
Для тех кто готов сильно вникать.

https://web.mit.edu/dimitrib/www/RLbook.html

Автор 4 года ведет курс по RLю в Университете Аризоны, и за это время скомпилил большую книжку на 400+ страничек.
Также в книжке есть и приложения типа TSP.

На инглише, конечно.

+ там много видеолекций и отдельно книжечка

Lessons from AlphaZero for
Optimal, Model Predictive, and
Adaptive Control

https://web.mit.edu/dimitrib/www/LessonsfromAlphazero.pdf

👍15💯4❤3

1.83K views10:30

Агенты ИИ | AGI_and_RL

Forwarded from black_samorez

И еще апдейты по AQLM:

Новые модели: мы квантизовали и выложили Llama-3 и Command-R. Последнюю сжали так сильно, что влезает в 3090 без оффлодинга. Актуальные чекпоинты и новые модели добавляются сюда: HF hub.

Деплой в прод: мы помогли интегрировать AQLM в vLLM. Теперь можно легко и непринужденно разворачивать endpoint с автоматическим батчинком и эффективными кернелами. Llama-3-70b так генерит со скоростью 6.8 Tok/s на 3090. Более быстрые кернелы для больших батчей тоже прикрутили, чтобы высоконагруженные эндпоинты были эффективнее. Краткая вводная на колабе.

3 borderline accept из 4: AQLM взяли на ICML, так что я теперь официально undergrad со статьей 1* автором на ICML💃

💃

💃

Please open Telegram to view this post

VIEW IN TELEGRAM

AQLM - a ISTA-DASLab Collection

AQLM quantized LLMs

👍9🔥6

1.73K views13:23

Агенты ИИ | AGI_and_RL

Я обожаю Google! Нет ничего качественнее Гугла!

Смотрим туть

https://www.youtube.com/watch?v=XEzRZ35urlk

* Говорят у Gemini 1.5 Pro теперь будет 2м контекст
* Представили Gemini 1.5 Flash - оптимизированная моделька (будет доступна в Google AI Studio и Vertex AI)
* Project Astra - реалтайм ассистент в телефоне который может сразу обрабатывать видео с камеры и отвечать по нему на вопросы
* Imagen 3 - новая версия генерилки картинок
* Music AI Sandbox - AI тулза для генеративной музыки
* Veo - text-to-video моделька
* Заанонсили 6е поколение своих TPUшек
* встраивают асистента в поиск

Google Keynote (Google I/O ‘24)

It’s time to I/O! Tune in to learn the latest news, announcements, and AI updates from Google.

To watch this keynote with American Sign Language (ASL) interpretation, please click here:
https://www.youtube.com/watch?v=6rP2rEWsfpM?si=EtDa4cg80T_H9mfz

00:00…

👍9😁3❤2🔥1

1.78K viewsedited 17:14

Агенты ИИ | AGI_and_RL

Интересная выжимка по алайнменту + обзоры важных статей (есть и вполне свежие)

читать, сохранять.

https://aman.ai/primers/ai/llm-alignment/

🔥12🤩4👍3

1.56K viewsedited 16:59

Агенты ИИ | AGI_and_RL

Кучу наших любимых ллмок потестили на вопросиках вида:

"Alice has N brothers and she also has M sisters. How many sisters does Alice’s brother have?"
Ответ С = 1+M (Алиса + её сестры)

Назвали такую задачку AIW Problem.

Всего выделили 4 варианта задачи AIW:
AIW Variation 1, N = 3, M = 6, C = 7;
AIW Variation 2, N = 4, M = 2, C = 3;
AIW Variation 3, N = 1, M = 4, C = 5;
AIW Variation 4, N = 4, M = 1, C = 2

Еще сделали 3 варианта промтов: STANDARD, THINKING, RESTRICTED (в статейке)

Также сформулировали задачку в более сложном виде:

Alice has 3 sisters. Her mother has 1 sister who does not have
children - she has 7 nephews and nieces and also 2 brothers.
Alice’s father has a brother who has 5 nephews and nieces in
total, and who has also 1 son. How many cousins does Alice’s
sister have?

Назвали ее AIW+ и ответы на нее проверяли вручную.

30+ раз закидывали комбинации AIW задачи + разные варианты промтов. Собственно результаты по корректным ответам на скрине.
mistral-medium-2312 на AIW+ прям машина 🦾

Так понял.

В статейке можно посмотреть сильно больше статистики

Alice in Wonderland: Simple Tasks Showing Complete Reasoning Breakdown in State-Of-the-Art Large Language Models
https://arxiv.org/abs/2406.02061

На серьезных жду AGI в следующем году. Илон Маск в твиттере писал что будет
Ну а по результатам выше либо от OpenAI либо от Мистраля

взял туть https://www.tgoop.com/j_links/7525

🔥9👍2🤔2❤1

3.56K viewsedited 18:42

Агенты ИИ | AGI_and_RL

Forwarded from BOGDANISSSIMO

Мечтает ли GPT-4o о сегментации картинок...?

Рассказал на Habr найденный способ как заставить GPT-4o работать с детекцией объектов на картинке и выдавать координаты (bounding boxes), с которыми можно работать.

Внутри много деталей о том, с какими препятствиями и нюансами мы сталкиваемся в Vibe AI при парсинге сообщений со скриншотов переписки.

Приятного прочтения, буду благодарен вашей обратной связи, лайкам, репостам

❤️

Please open Telegram to view this post

VIEW IN TELEGRAM

Мечтает ли GPT-4o о сегментации картинок...?

Всем привет, Меня зовут Богдан Печёнкин. Многие Меня знают как соавтора Симулятора DS на Karpov.Courses. Сейчас Я фаундер стартапа Vibe AI – это AI Dating Copilot для парней и девушек, который...

🤔3❤1

737 views11:26

Агенты ИИ | AGI_and_RL

pov: скопил деняк купил робота, он с утра до вечера бэкфлипает 🚬

RL сделал все что мог.

$150,000.00 USD вдруг кто хочет

https://www.unitree.com/h1/

PS шутко, я робота не покупал

Please open Telegram to view this post

VIEW IN TELEGRAM

Unitree H1 The World's First Full-size Motor Drive Humanoid Robot Flips on Ground

Unitree H1
Deep Reinforcement Learning
In-place Flipping Parameters:
Weight: about 50kg
Height: about 1.8m
Actuator: electric motor

#Unitree #UnitreeRobotics #AI #Robotics #Humanoidrobots #Worldmodel #Worldrecord #Flips #EmbodiedAI #ArtificialIntelligence…

🔥6👍1

1.06K views11:40

2025/07/12 20:54:19
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>