AI 闪记纪要：对罗福莉 3.5 小时访谈

AI范式已然巨变｜OpenClaw、Agent范式很吃后训练、卡的分配、组织平权

张小珺Jùn｜商业访谈录

平台：小宇宙时长：217分钟发布：2026-04-24

1 范式转折：从 Chat 到 Agent 的结构性跃迁

2026年大模型战争进入第二幕。由 Claude Opus 4.6、OpenClaw 等技术变量触发，AI 范式发生根本性巨变。

从 Pre-train（预训练）主导的 Chat 时代，全面转向 Post-train（后训练）主导的 Agent 时代。

“当人类的知识与智慧内化为模型能力，未来的人类去做什么？我们的社会如何消化这次剧烈的技术变革？”

💡 关键判断：Anthropic 的路径已被验证为正确，成为当下行业共识。国内大模型团队正进入加速追赶状态。Pre-train 代差已基本抹平，竞争焦点全面转移。

2 Agent 架构与后训练 Scaling

00:24:17

群体智能提升
Agent 框架依赖多智能体协同与编排工程，解决单一模型能力瓶颈。

00:41:31

系统重心转移
从“以 Rollout 推理引擎为核心”转变为“以 Agent 为核心”的复杂系统。

01:01:45

自进化与迭代
模型能力内化后，Agent 可实现“左脚踩右脚”的自我提升与 Workflow 自动化。

Agent 范式极度依赖后训练（Post-train），特别是 RL 的 Scaling。团队必须具备足够敏捷性，快速开发适配新时代的 RL Infra 系统。接下来两三个月是考验团队研究水平与技术拥抱能力的关键期。

3 资源重构：算力分配与组织平权

🎯 管理启示：算力与人力必须向 Post-train 倾斜。组织架构需从“流水线式”转向“敏捷网状”，以适配快速迭代的 Agent 研发节奏。

4 模型 Scaling 路径与未来押注

1T 模型是当前阶段的基准入场券。MiMo-V2 系列即在此规模下实现能力跃升。

不会在 1T 水平停留太久。需立即决策：是 Scaling 参数量，还是 Scaling 其他维度？

在何种芯片架构上进行 Scaling？硬件选型直接决定大半年后的技术领先度。

“如果要拿到下一个阶段的领先，就要寻求更大规模 scaling。这是当下立即需要去决策和判断的，这才决定了大半年过后谁更领先。”

5 行业共识、竞争与认知迭代

Pre-train 代差已基本抹平。国内团队全面 All-in Agent Post-train。技术追赶从“补基础”转向“拼敏捷”。

“每天在否认昨天的自己。”AI 没有生存危机，但面临范式转折。一线经验与真实环境比过往理论更重要。

02:39:12

研究者自身工作也面临被 Skill 化、Workflow 化的风险。

03:05:54

Anthropic 路径成共识，追赶窗口期缩短。

03:19:45

环境比经验更重要，实战试错驱动技术突破。