Telegram Web
Forwarded from Garyの梦呓
DeepScaleR-1.5B-Preview

DeepscaleR-1.5b 是在 DeepSeekR1-distilled-Qwen1.5b 上仅使用 3800 A100h(~$4500) 进行 RL 微调的 LLM

该模型在 AIME 2024 上获得了 43.1%@1 的准确性,较基底(28.8%)提高 14%,在 1.5B 参数下超过了 o1-preview
(Arena Math 中 R1>Gemini 2 Thinking>o1p>Gemini 2 Pro)

Open sourced dataset, code, training logs and models
Github: Github.com/agentica-project/deepscaler
Inference GGUF
#AI
Text to image 领域是不是最近都没啥发展了
Forwarded from 咕谷の小窝 | 冷冷啦 (こばとちゃん|発売中...)
Forwarded from 煎蛋无聊图
种田能手: https://jandan.net/t/5855198
OO: 413 XX: 26
蛋友24cbe9bb9d22: 星露谷简化了所有的付出与收获,啥都是简单模式可不是谁都想这样么
OO: 222, XX: 0
蛋友24cbe9b71c48: 人人都只想着要努力,从来没考虑过正面反馈
OO: 60, XX: 1
蛋友e62185ff69982: mama,wo wuwu ~
OO: 39, XX: 0
噜啦啦: 游戏角色可是不会饥饿,不惧烈日狂风的超人。现实里叫你顶着太阳去送个外卖可能你都不愿意
OO: 20, XX: 1
Forwarded from 咕咕咕 开始🐍
册那
Forwarded from 煎蛋无聊图
fith: https://jandan.net/t/5854880
OO: 441 XX: 3
哦嚯: 本质上与翻洗肥肠一样
OO: 154, XX: 1
非正常人类研究中心: 超立方体
OO: 109, XX: 1
山青: @哦嚯 透过现象看到本质,你绝对就是天才
OO: 46, XX: 1
xianii: 旋转的超立方体的三维投影。
OO: 34, XX: 1
GuTou: @哦嚯 被你的才华与学识震惊!
OO: 15, XX: 0
Forwarded from Foolish TraceWind (TraceWind | 超级倒霉笨蛋)
在打复活赛了
Forwarded from Foolish TraceWind (TraceWind | 超级倒霉笨蛋)
2025/02/20 11:15:38
Back to Top
HTML Embed Code: