让AI连续工作10小时不崩溃?揭秘Anthropic官方推崇的“Harness工程”!


很多人用Claude Code跑长任务,跑着跑着AI就变傻、甚至罢工。
原因很简单:上下文窗口爆了。
今天分享一套让AI“无限续航”的系统级方案(Harness Engineering),不仅能让AI干活,还能让它自我进化。
1⃣ 核心原理:重置上下文
AI的记性有限。官方Anthropic的思路是:把大任务拆碎,每次只让AI在一个全新的、干净的上下文里干一件小事。
❌ 错误做法:把所有需求一次性塞给AI。
✅ 正确做法:拆解任务 -> 独立会话执行 -> 记录进度 -> 下一个循环。
2⃣ 方案对比:Ralph vs 多智能体
方案A(Ralph循环): 用Bash脚本写个while循环,强制重启新会话。简单粗暴,适合极客。
方案B(多智能体协同 - 推荐): 我在用的方案。更灵活,更像真实团队。
主Agent(Coordinator): 只负责调度,绝不写代码(保持上下文极其干净)。
子Agent(Workers): 计划、开发、测试(布局/美观/动画)。各司其职,独立上下文。
3⃣ 工作流设计(关键!)
我的实战工作流:
主Agent 接收需求 -> 丢给 计划Agent 出排期。
主Agent 拿到计划 -> 派给 开发Agent 写代码(只传文件路径,不传大段代码!)。
开发完 -> 派给 测试Agent 找Bug。
Bug修复闭环: 测试挂了?用 resume 参数唤醒同一个开发Agent修Bug(保留现场上下文),而不是开新号!
4⃣ 让AI自我进化的Secret Sauce
Lessons Learned: 建一个经验库文件。每次踩坑,强制AI把错误写进去。下一次开发,先读这个文件,避免重复犯错。
文件通信: Agent之间只传文件路径(Path),不传具体内容。主Agent的上下文永远只有几行字,永不爆窗。
这套系统我跑了一个通宵,生成了20多页PPT,质量极高。
真正的Harness不是让AI更聪明,而是设计一套不依赖AI记性的流程。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论