Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
8012 - Telegram Web
Telegram Web
Training superhuman coding models at Cursor

Случайно наткнулся на видео, где ребята из Cursor обсуждают всякое разное про LLM. Обычно в подобных подкастах все высказывания очень поверхносные, чтобы случайно не выдать каких-нибудь секретов. А тут на удивление упомянули довольно много технических деталей.

Краткий список затронутых тем:
- Как делать RL, когда нет одного правильного ответа?
- Что делать, если вероятность получить "правильный" ответ очень маленькая?
- Как сделать, чтобы модель могла ориентироваться в большом проекте?
- Как поддерживать long context?
- Как делать credit assignment для memory tool?
- Как cursor может обучаться на пользовательских данных.
- Почему плохо смотреть на лайки/дизлайки ответов.
- Какая инфра нужна для больших RL тренировок.

Судя по количеству просмотров, если сам этим не занимаешься, то смотреть не очень интересно. Но мне понравилось!
🔥122😱1
Forwarded from Axis of Ordinary
This media is not supported in your browser
VIEW IN TELEGRAM
We made Claude, Gemini, o3 battle each other for world domination.

We taught them Diplomacy—the strategy game where winning requires alliances, negotiation, and betrayal.

Here's what happened:

DeepSeek turned warmongering tyrant. Claude couldn't lie—everyone exploited it ruthlessly. Gemini 2.5 Pro nearly conquered Europe with brilliant tactics. Then o3 orchestrated a secret coalition, backstabbed every ally, and won.


More: https://every.to/diplomacy
3👍2
Surprisingly Fast AI-Generated Kernels We Didn’t Mean to Publish (Yet) https://crfm.stanford.edu/2025/05/28/fast-kernels.html
👍3
Forwarded from Vladislav 🇺🇸🚜
Just links
https://livecodebenchpro.com/
LiveCodeBench Pro: How Do Olympiad Medalists Judge LLMs in Competitive Programming? https://arxiv.org/abs/2506.11928
2025/07/14 16:14:26
Back to Top
HTML Embed Code: