94 lines
2.5 KiB
Markdown
Executable File
94 lines
2.5 KiB
Markdown
Executable File
---
|
||
title: 参考资料 - Harness Engineering
|
||
tags:
|
||
- 参考资料
|
||
- AI Agent
|
||
- Harness Engineering
|
||
created: 2026-04-21
|
||
updated: 2026-04-21
|
||
---
|
||
|
||
# Harness Engineering 参考资料
|
||
|
||
> 基于 11 篇原始资料整理
|
||
>
|
||
> 来源:OpenAI、Anthropic、Thoughtworks、LangChain、HumanLayer、Inngest、学术界 (CAR框架) 及 walkinglabs 课程资料
|
||
>
|
||
> 整理日期:2026-04-20
|
||
|
||
---
|
||
|
||
## 原始文档
|
||
|
||
| 文件 | 说明 |
|
||
|------|------|
|
||
| [[什么是Harness_Engineering.pdf]] | 完整介绍文档 (217KB) |
|
||
|
||
---
|
||
|
||
## 核心概念
|
||
|
||
**核心公式**:
|
||
```
|
||
AI Agent = Model(模型) + Harness(挽具/环境)
|
||
```
|
||
|
||
Harness 是围绕 AI 模型构建的一切——工具、指令、状态管理、验证机制、运行时基础设施——它让模型的智能变得"可用"。
|
||
|
||
---
|
||
|
||
## 主要机构观点
|
||
|
||
| 机构 | 定义侧重点 |
|
||
|------|-----------|
|
||
| LangChain | 最宽泛:Harness = 除模型以外的一切 |
|
||
| Anthropic | 环境脚手架,强调长期运行的连续性与状态管理 |
|
||
| OpenAI | 环境设计、反馈回路、控制系统 |
|
||
| Thoughtworks | 赛博内廷(cybernetic governor),区分"构建者挽具"与"使用者挽具" |
|
||
| HumanLayer | Context Engineering 的子集,强调防止"上下文腐烂" |
|
||
| Inngest | 持久化事件驱动基础设施 |
|
||
| 学术界 | CAR框架(Control-Agency-Runtime) |
|
||
|
||
---
|
||
|
||
## 五大子系统 (walkinglabs)
|
||
|
||
| 子系统 | 说明 |
|
||
|--------|------|
|
||
| Instructions | 告诉 Agent 做什么、按什么顺序、读什么文件 |
|
||
| State | 追踪进度,持久化到磁盘 |
|
||
| Verification | 只有通过测试才算完成 |
|
||
| Scope | 约束每次一个功能 |
|
||
| Session Lifecycle | 开始初始化,结束清理 |
|
||
|
||
---
|
||
|
||
## 控制类型
|
||
|
||
| 类型 | 说明 |
|
||
|------|------|
|
||
| 计算型 (Computational) | 确定性、快速(测试、linter、类型检查) |
|
||
| 推理型 (Inferential) | 语义分析、AI代码审查(GPU运行,速度慢) |
|
||
|
||
---
|
||
|
||
## 三类调控维度
|
||
|
||
| 维度 | 说明 |
|
||
|------|------|
|
||
| 可维护性挽具 | 代码内部质量(重复代码、圈复杂度、测试覆盖率) |
|
||
| 架构适应性挽具 | 架构特征(性能要求、可观测性标准) |
|
||
| 行为挽具 | 功能正确性(规格说明、测试套件、端到端验证) |
|
||
|
||
---
|
||
|
||
## 核心优势
|
||
|
||
Anthropic 受控实验表明:
|
||
- 同一模型(Opus 4.5)、同一提示
|
||
- **有 Harness**:$9 / 20 分钟,产出可用
|
||
- **无 Harness**:$20 / 多倍时间,产出不可用
|
||
|
||
---
|
||
|
||
*整理:知识库管理员 | 归档:2026-04-21* |