AI 闪记纪要:对罗福莉 3.5 小时访谈

六点下班 · 加入组织
AI范式已然巨变|OpenClaw、Agent范式很吃后训练、卡的分配、组织平权
节目封面
张小珺Jùn|商业访谈录
平台:小宇宙 时长:217分钟 发布:2026-04-24
1 范式转折:从 Chat 到 Agent 的结构性跃迁

🔄 核心变量

2026年大模型战争进入第二幕。由 Claude Opus 4.6、OpenClaw 等技术变量触发,AI 范式发生根本性巨变。

📉 时代转向

Pre-train(预训练)主导的 Chat 时代,全面转向 Post-train(后训练)主导的 Agent 时代

“当人类的知识与智慧内化为模型能力,未来的人类去做什么?我们的社会如何消化这次剧烈的技术变革?”
💡 关键判断:Anthropic 的路径已被验证为正确,成为当下行业共识。国内大模型团队正进入加速追赶状态。Pre-train 代差已基本抹平,竞争焦点全面转移。
2 Agent 架构与后训练 Scaling
00:24:17
群体智能提升
Agent 框架依赖多智能体协同与编排工程,解决单一模型能力瓶颈。
00:41:31
系统重心转移
从“以 Rollout 推理引擎为核心”转变为“以 Agent 为核心”的复杂系统。
01:01:45
自进化与迭代
模型能力内化后,Agent 可实现“左脚踩右脚”的自我提升与 Workflow 自动化。

⚙️ 技术敏捷性要求

Agent 范式极度依赖后训练(Post-train),特别是 RL 的 Scaling。团队必须具备足够敏捷性,快速开发适配新时代的 RL Infra 系统。接下来两三个月是考验团队研究水平与技术拥抱能力的关键期。

3 资源重构:算力分配与组织平权

📊 用卡比例巨变

  • Chat 时代:研究:预训练:后训练 ≈ 3:5:1
  • Agent 时代:预训练:后训练 ≈ 1:1(顶尖团队)
  • 合理比例趋向 3:1:1,后训练算力需求暴增。

👥 组织与人员重组

  • 后训练需要 diversity(多样性)
  • 让预训练人员转做后训练是极佳补充。
  • 打破部门壁垒,实现组织平权与能力复用。
🎯 管理启示:算力与人力必须向 Post-train 倾斜。组织架构需从“流水线式”转向“敏捷网状”,以适配快速迭代的 Agent 研发节奏。
4 模型 Scaling 路径与未来押注

🎫 入场券

1T 模型是当前阶段的基准入场券。MiMo-V2 系列即在此规模下实现能力跃升。

📈 下一步决策

不会在 1T 水平停留太久。需立即决策:是 Scaling 参数量,还是 Scaling 其他维度?

🔧 芯片适配

在何种芯片架构上进行 Scaling?硬件选型直接决定大半年后的技术领先度。

“如果要拿到下一个阶段的领先,就要寻求更大规模 scaling。这是当下立即需要去决策和判断的,这才决定了大半年过后谁更领先。”
5 行业共识、竞争与认知迭代

🌍 竞争态势

Pre-train 代差已基本抹平。国内团队全面 All-in Agent Post-train。技术追赶从“补基础”转向“拼敏捷”。

🧠 认知迭代

“每天在否认昨天的自己。”AI 没有生存危机,但面临范式转折。一线经验与真实环境比过往理论更重要。

02:39:12
研究者自身工作也面临被 Skill 化、Workflow 化的风险。
03:05:54
Anthropic 路径成共识,追赶窗口期缩短。
03:19:45
环境比经验更重要,实战试错驱动技术突破。