https://mp.weixin.qq.com/s/0CBF-d5my070pQWatIMmxA
试着回答一个问题:为什么情感陪伴类 AI 在火了一小段时间之后,都逐渐走向了衰落。
极简回答:因为比起工作场景,我们的情感需求往往需要更长、更复杂的上下文。
全文万字,包含一个快速在 ChatGPT 和 Gemini 中复刻的上下文工程⬇️。
试着回答一个问题:为什么情感陪伴类 AI 在火了一小段时间之后,都逐渐走向了衰落。
极简回答:因为比起工作场景,我们的情感需求往往需要更长、更复杂的上下文。
全文万字,包含一个快速在 ChatGPT 和 Gemini 中复刻的上下文工程⬇️。
刚刚完成了人生中的两个第一次:
第一次在工厂车间完成了三小时的直播主持;
第一次和人形机器人一起搭档主持;
期待一下后续在《商业漫谈》登陆的内容沉淀吧~
全球首次通用具身机器人落地工业场景进行常态化作业的——3小时连续不间断直播。给智元的远征A2W(图五)鼓掌,工作三小时零失误。
也给安努智能、富临精工这些第一批吃螃蟹的公司鼓掌。
“因为相信,所以看见。”
第一次在工厂车间完成了三小时的直播主持;
第一次和人形机器人一起搭档主持;
期待一下后续在《商业漫谈》登陆的内容沉淀吧~
全球首次通用具身机器人落地工业场景进行常态化作业的——3小时连续不间断直播。给智元的远征A2W(图五)鼓掌,工作三小时零失误。
也给安努智能、富临精工这些第一批吃螃蟹的公司鼓掌。
“因为相信,所以看见。”
❤5
总结一些 Grok 4 发布的相关信息,就不做测试了,跟主流模型拉不开差距。
包括 Grok 4 和 Grok 4 Heavy 两个模型。#ai创造营##马斯克#
内置了工具链调用能力,支持检索、代码执行、计算器等工具。
256K 上下文窗口,支持文本、图像、结构化数据输入。
预训练阶段相较 Grok 3 提升约 10 倍。Grok 4 reasoning 在 RL 阶段再 提升 10 倍。
APP 现在三个会员等级:
基础会员现在只能免费用 Grok3 了
SuperGrok 300 美金一年,支持 128K 上下文的 Gork4,语音和视觉输入。
SuperGrok Heavy 3000 美金一年,可以抢先体验新功能,使用 Grok 4 Heavy 模型。
API同步推出: Grok 4模型,输入 3美元、输出 15 美元,输出价格接近 o3 的两倍,太贵了。
基准测试结果上:
Humanity’s Last Exam(2500 题,100+ 学科)Grok 4 Heavy + 工具刷到了44.4 %,o3 约为 21%。
AIME25(数学竞赛):Grok 4 Heavy = 100 %(满分)。
USAMO25(数学证明):Grok 4 Heavy = 61.9 %,领先次席 24 pp。
Chest Agent Bench(胸片 Agent 任务):Grok 4 = 72.8 %,行业最高。
Vending-Bench(商业运营模拟):Grok 4 人均净资产 $4694(第 2 名约 $2077)。
未来路线图:
7 月:Grok 4 Release(已完成)。
8 月:Coding Model(代码生成与代理)。
9 月:Multi-modal Agent(统一文本-图像-工具的任务执行)。
10 月:Video Generation Model(视频生成,对标 Sora / Veo)。
包括 Grok 4 和 Grok 4 Heavy 两个模型。#ai创造营##马斯克#
内置了工具链调用能力,支持检索、代码执行、计算器等工具。
256K 上下文窗口,支持文本、图像、结构化数据输入。
预训练阶段相较 Grok 3 提升约 10 倍。Grok 4 reasoning 在 RL 阶段再 提升 10 倍。
APP 现在三个会员等级:
基础会员现在只能免费用 Grok3 了
SuperGrok 300 美金一年,支持 128K 上下文的 Gork4,语音和视觉输入。
SuperGrok Heavy 3000 美金一年,可以抢先体验新功能,使用 Grok 4 Heavy 模型。
API同步推出: Grok 4模型,输入 3美元、输出 15 美元,输出价格接近 o3 的两倍,太贵了。
基准测试结果上:
Humanity’s Last Exam(2500 题,100+ 学科)Grok 4 Heavy + 工具刷到了44.4 %,o3 约为 21%。
AIME25(数学竞赛):Grok 4 Heavy = 100 %(满分)。
USAMO25(数学证明):Grok 4 Heavy = 61.9 %,领先次席 24 pp。
Chest Agent Bench(胸片 Agent 任务):Grok 4 = 72.8 %,行业最高。
Vending-Bench(商业运营模拟):Grok 4 人均净资产 $4694(第 2 名约 $2077)。
未来路线图:
7 月:Grok 4 Release(已完成)。
8 月:Coding Model(代码生成与代理)。
9 月:Multi-modal Agent(统一文本-图像-工具的任务执行)。
10 月:Video Generation Model(视频生成,对标 Sora / Veo)。
❤1