Warning: mkdir(): No space left on device in /var/www/tgoop/post.php on line 37

Warning: file_put_contents(aCache/aDaily/post/scientific_opensource/--): Failed to open stream: No such file or directory in /var/www/tgoop/post.php on line 50
Научный опенсорс@scientific_opensource P.148
SCIENTIFIC_OPENSOURCE Telegram 148
На недавно прошедшем митапе (видео докладов и фото скоро будут) докладчикам поступало много вопросов про пределы возможностей ИИ для разработки ПО.

В связи с этим, хочется упомянуть про интересное направление "моделей мира".
Коллеги из ICT Moscow на днях опубликовали как раз опубликовали обзор про таковые.

Помимо применимость для задач общего назначения - это довольно актуальное направление развития AI4Code.
Так, буквально на днях была выложена открытая Code World Model с 32B параметров - https://github.com/facebookresearch/cwm

В чем тут идея таких моделей в контексте работы с кодом (процитирую тут разбор) - в отличие от привычных LLM, они могут:
- Симулировать выполнение без запуска (даем ей код с аргументами, она предскажет результат)
- Планировать исправления (будет понимать, какие изменения к каким последствиям приведут)
- Работать как дебаггер (может прыгнуть к любой строке и предсказать состояние)

Направление пока скорее исследовательское, но результаты на бенчмарках уже вполне достойные:
"CWM offers strong performance on general coding and math tasks: it reaches pass@1 scores of 65.8 % on SWE-bench Verified (with test-time scaling), 68.6 % on LiveCodeBench, 96.6 % on Math-500, and 76.0 % on AIME 2024"
🔥94



tgoop.com/scientific_opensource/148
Create:
Last Update:

На недавно прошедшем митапе (видео докладов и фото скоро будут) докладчикам поступало много вопросов про пределы возможностей ИИ для разработки ПО.

В связи с этим, хочется упомянуть про интересное направление "моделей мира".
Коллеги из ICT Moscow на днях опубликовали как раз опубликовали обзор про таковые.

Помимо применимость для задач общего назначения - это довольно актуальное направление развития AI4Code.
Так, буквально на днях была выложена открытая Code World Model с 32B параметров - https://github.com/facebookresearch/cwm

В чем тут идея таких моделей в контексте работы с кодом (процитирую тут разбор) - в отличие от привычных LLM, они могут:
- Симулировать выполнение без запуска (даем ей код с аргументами, она предскажет результат)
- Планировать исправления (будет понимать, какие изменения к каким последствиям приведут)
- Работать как дебаггер (может прыгнуть к любой строке и предсказать состояние)

Направление пока скорее исследовательское, но результаты на бенчмарках уже вполне достойные:
"CWM offers strong performance on general coding and math tasks: it reaches pass@1 scores of 65.8 % on SWE-bench Verified (with test-time scaling), 68.6 % on LiveCodeBench, 96.6 % on Math-500, and 76.0 % on AIME 2024"

BY Научный опенсорс


Share with your friend now:
tgoop.com/scientific_opensource/148

View MORE
Open in Telegram


Telegram News

Date: |

To upload a logo, click the Menu icon and select “Manage Channel.” In a new window, hit the Camera icon. Telegram Channels requirements & features For crypto enthusiasts, there was the “gm” app, a self-described “meme app” which only allowed users to greet each other with “gm,” or “good morning,” a common acronym thrown around on Crypto Twitter and Discord. But the gm app was shut down back in September after a hacker reportedly gained access to user data. Matt Hussey, editorial director at NEAR Protocol also responded to this news with “#meIRL”. Just as you search “Bear Market Screaming” in Telegram, you will see a Pepe frog yelling as the group’s featured image. Hui said the time period and nature of some offences “overlapped” and thus their prison terms could be served concurrently. The judge ordered Ng to be jailed for a total of six years and six months.
from us


Telegram Научный опенсорс
FROM American