(图为群友拿 r1 搞的离谱涩涩 这玩意一个 cot 模型怎么 rp 这么得劲)
DeepSeek 真属于是大模型圣人了,几乎有啥开啥,推理服务还量大管饱,甚至资源紧张的时候优先保证 Web 端(免费使用)的供应,先停 API...
上午群友还在讨论有没有谁去蒸馏一份 r1-preview 下午官方就直接放了蒸馏的小版本 属实是饭喂嘴里 送佛送到西了
还有 r1-zero 这种纯靠 rl 没有 sft 搞出来的神秘东西...
强烈建议群友快去试试 DeepSeek v3 和 r1-preview,效果非常一流,虽然一些方面打不过 o1 也是顶尖模型了(benchmark 基本可以和 o1 打平甚至超越)
https://huggingface.co/deepseek-ai/DeepSeek-R1
DeepSeek 真属于是大模型圣人了,几乎有啥开啥,推理服务还量大管饱,甚至资源紧张的时候优先保证 Web 端(免费使用)的供应,先停 API...
上午群友还在讨论有没有谁去蒸馏一份 r1-preview 下午官方就直接放了蒸馏的小版本 属实是饭喂嘴里 送佛送到西了
还有 r1-zero 这种纯靠 rl 没有 sft 搞出来的神秘东西...
强烈建议群友快去试试 DeepSeek v3 和 r1-preview,效果非常一流,虽然一些方面打不过 o1 也是顶尖模型了(benchmark 基本可以和 o1 打平甚至超越)
https://huggingface.co/deepseek-ai/DeepSeek-R1
🤯85🔥13
规则里好像没有规定必须把棋子放在自己的棋盒盖上,那么其实我可以放在对方的棋盒盖上。
这样一来游戏性质就变成了谁先把对方的棋盒盖放满,同时保护好自己的棋盒盖不被对方放棋子,想想还挺刺激的。
这样一来游戏性质就变成了谁先把对方的棋盒盖放满,同时保护好自己的棋盒盖不被对方放棋子,想想还挺刺激的。
🔥47😁16