2.5 KiB
Executable File
2.5 KiB
Executable File
title, tags, created, updated
| title | tags | created | updated | |||
|---|---|---|---|---|---|---|
| 参考资料 - Harness Engineering |
|
2026-04-21 | 2026-04-21 |
Harness Engineering 参考资料
基于 11 篇原始资料整理
来源:OpenAI、Anthropic、Thoughtworks、LangChain、HumanLayer、Inngest、学术界 (CAR框架) 及 walkinglabs 课程资料
整理日期:2026-04-20
原始文档
| 文件 | 说明 |
|---|---|
| 什么是Harness_Engineering.pdf | 完整介绍文档 (217KB) |
核心概念
核心公式:
AI Agent = Model(模型) + Harness(挽具/环境)
Harness 是围绕 AI 模型构建的一切——工具、指令、状态管理、验证机制、运行时基础设施——它让模型的智能变得"可用"。
主要机构观点
| 机构 | 定义侧重点 |
|---|---|
| LangChain | 最宽泛:Harness = 除模型以外的一切 |
| Anthropic | 环境脚手架,强调长期运行的连续性与状态管理 |
| OpenAI | 环境设计、反馈回路、控制系统 |
| Thoughtworks | 赛博内廷(cybernetic governor),区分"构建者挽具"与"使用者挽具" |
| HumanLayer | Context Engineering 的子集,强调防止"上下文腐烂" |
| Inngest | 持久化事件驱动基础设施 |
| 学术界 | CAR框架(Control-Agency-Runtime) |
五大子系统 (walkinglabs)
| 子系统 | 说明 |
|---|---|
| Instructions | 告诉 Agent 做什么、按什么顺序、读什么文件 |
| State | 追踪进度,持久化到磁盘 |
| Verification | 只有通过测试才算完成 |
| Scope | 约束每次一个功能 |
| Session Lifecycle | 开始初始化,结束清理 |
控制类型
| 类型 | 说明 |
|---|---|
| 计算型 (Computational) | 确定性、快速(测试、linter、类型检查) |
| 推理型 (Inferential) | 语义分析、AI代码审查(GPU运行,速度慢) |
三类调控维度
| 维度 | 说明 |
|---|---|
| 可维护性挽具 | 代码内部质量(重复代码、圈复杂度、测试覆盖率) |
| 架构适应性挽具 | 架构特征(性能要求、可观测性标准) |
| 行为挽具 | 功能正确性(规格说明、测试套件、端到端验证) |
核心优势
Anthropic 受控实验表明:
- 同一模型(Opus 4.5)、同一提示
- 有 Harness:$9 / 20 分钟,产出可用
- 无 Harness:$20 / 多倍时间,产出不可用
整理:知识库管理员 | 归档:2026-04-21