Update from Sync Service
This commit is contained in:
@@ -1,7 +1,65 @@
|
||||
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
|
||||
<html><head>
|
||||
<title>404 Not Found</title>
|
||||
</head><body>
|
||||
<h1>Not Found</h1>
|
||||
<p>The requested URL was not found on this server.</p>
|
||||
</body></html>
|
||||
---
|
||||
title: 智能体软件工程(Agentic SE)
|
||||
tags:
|
||||
- AI-Agent
|
||||
- 软件工程
|
||||
- 方法论
|
||||
- 学术
|
||||
created: 2026-04-21
|
||||
source: 艾哈迈德·E·哈桑(Ahmed E. Hassan),2026年
|
||||
translator: 李豪
|
||||
---
|
||||
|
||||
# 智能体软件工程
|
||||
|
||||
> 与随机性队友一起以前所未有的规模构建可信赖的软件
|
||||
|
||||
## 关于作者
|
||||
|
||||
**艾哈迈德·E·哈桑(Ahmed E. Hassan)教授**
|
||||
- 穆斯塔法奖得主(常比作诺贝尔级别荣誉)
|
||||
- ACM Fellow、IEEE Fellow、AAIA Fellow
|
||||
- 加拿大研究主席(Canada Research Chair)
|
||||
- 加拿大女王大学 NSERC/BlackBerry 软件工程工业研究主席
|
||||
- 全球引用次数最多的软件工程研究人员之一
|
||||
- 唯一同时获得 ACM SIGSOFT 有影响力教育家奖(2019)和 IEEE TCSE 杰出教育家奖(2020)的学者
|
||||
- 已培养出 35 位高校教授
|
||||
|
||||
## 核心论点
|
||||
|
||||
> **AI 不是工具,而是队友**——一个能力强大但会犯错的队友。因此,可靠性不能依赖于 AI 本身的完美,而必须通过工程系统来保障。
|
||||
|
||||
当 AI 能以前所未有的速度生成代码时,软件工程该怎么做?
|
||||
|
||||
## 四大部分结构
|
||||
|
||||
| 部分 | 内容 |
|
||||
|------|------|
|
||||
| **第一部分** | 建立概念基础 |
|
||||
| **第二部分** | 解决 AI 队友的可靠性问题 |
|
||||
| **第三部分** | 将协作扩展到团队规模 |
|
||||
| **第四部分** | 为不同角色提供行动指南 |
|
||||
|
||||
## 读书建议
|
||||
|
||||
| 角色 | 建议 |
|
||||
|------|------|
|
||||
| 技术负责人/工程管理者 | 第一部分顺序读起,重点看第三、四部分 |
|
||||
| 一线开发者 | 第一、二部分是核心章节 |
|
||||
| 时间有限者 | 直接读第四部分(全书浓缩与行动路线图) |
|
||||
|
||||
## 与其他框架的关系
|
||||
|
||||
| 框架 | 关系 |
|
||||
|------|------|
|
||||
| **Harness Engineering** | Agentic SE 的第二部分对应可靠性保障 |
|
||||
| **Superpowers** | Agentic SE 的第三部分对应团队协作扩展 |
|
||||
| **Agent = Model + Harness** | 两本书共享同一核心公式 |
|
||||
|
||||
## 译者序摘要
|
||||
|
||||
译者李豪:
|
||||
- 这是一部从软件工程学科本身出发,严肃思考人与 AI 如何协作构建可信赖软件的著作
|
||||
- 本书提出了**智能体软件工程**这一框架
|
||||
- 核心论点:可靠性不能依赖于 AI 本身的完美,而必须通过工程系统来保障
|
||||
|
||||
|
||||
@@ -1,7 +1,129 @@
|
||||
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
|
||||
<html><head>
|
||||
<title>404 Not Found</title>
|
||||
</head><body>
|
||||
<h1>Not Found</h1>
|
||||
<p>The requested URL was not found on this server.</p>
|
||||
</body></html>
|
||||
---
|
||||
title: Harness Engineering 知识体系
|
||||
tags:
|
||||
- AI-Agent
|
||||
- Engineering
|
||||
- Prompt-Engineering
|
||||
- Context-Engineering
|
||||
created: 2026-04-21
|
||||
source: 基于11篇原始资料整理(OpenAI/Anthropic/Thoughtworks/LangChain/HumanLayer/Inngest/学术界)
|
||||
---
|
||||
|
||||
# Harness Engineering
|
||||
|
||||
> AI Agent = Model + Harness
|
||||
>
|
||||
> *"The model contains the intelligence and the harness is the system that makes that intelligence useful."* — LangChain
|
||||
|
||||
## 核心定义
|
||||
|
||||
**Harness** = 除模型以外的一切——工具、指令、状态管理、验证机制、运行时基础设施
|
||||
|
||||
让模型输出从"不可靠"变成"可信赖"的工程体系。
|
||||
|
||||
---
|
||||
|
||||
## 各机构视角
|
||||
|
||||
| 机构 | 侧重点 |
|
||||
|------|--------|
|
||||
| **LangChain** | 最宽泛:Harness = 一切非模型的技术层 |
|
||||
| **Anthropic** | 环境脚手架 + 长任务连续性 + clean state 理念 |
|
||||
| **OpenAI** | 代码仓库即知识系统,强调"零人工代码"自动化 |
|
||||
| **Thoughtworks** | 赛博内廷(cybernetic governor),区分"构建者挽具"vs"用户挽具" |
|
||||
| **HumanLayer** | Harness = Context Engineering 的子集,专注上下文窗口管理 |
|
||||
| **Inngest** | 持久化事件驱动基础设施 |
|
||||
| **学术界(CAR框架)** | Control + Agency + Runtime 三元框架 |
|
||||
|
||||
---
|
||||
|
||||
## 五大大子系统(walkinglabs 综合框架)
|
||||
|
||||
### 1. Instructions(指令)
|
||||
告诉 Agent 做什么、按什么顺序、读什么文件。采用**渐进式披露**(Progressive Disclosure),而非巨型文件。
|
||||
|
||||
### 2. State(状态)
|
||||
追踪已完成什么、正在做什么、接下来是什么。**持久化到磁盘**,确保会话间连续性。
|
||||
|
||||
### 3. Verification(验证)
|
||||
只有通过测试才算完成。Agent 不能在无可运行证据的情况下宣告任务完成。
|
||||
|
||||
### 4. Scope(范围)
|
||||
将 Agent 约束到**每次一个功能**,防止过度扩展和半途而废。
|
||||
|
||||
### 5. Session Lifecycle(会话生命周期)
|
||||
- 开始时初始化
|
||||
- 结束时清理
|
||||
- 为下一次会话留下清晰的重启路径
|
||||
|
||||
---
|
||||
|
||||
## 两类控制(Thoughtworks)
|
||||
|
||||
| 类型 | 计算型 | 推理型 |
|
||||
|------|--------|--------|
|
||||
| 执行 | CPU确定性快速 | GPU/NPU语义分析 |
|
||||
| 例子 | 测试/linter/类型检查 | LLM as Judge/AI代码审查 |
|
||||
| 特点 | 结果可靠 | 成本高但能处理语义判断 |
|
||||
|
||||
### 前馈导引 + 反馈传感
|
||||
- **前馈导引**(Feedforward Guides):在工作前注入上下文(AGENTS.md、技能文件、引导脚本)
|
||||
- **反馈传感**(Feedback Sensors):工作后检测问题(静态分析、日志、测试)
|
||||
|
||||
---
|
||||
|
||||
## 三类调控维度(Thoughtworks)
|
||||
|
||||
| 维度 | 调控内容 | 例子 |
|
||||
|------|----------|------|
|
||||
| **可维护性挽具** | 代码内部质量 | 重复代码、圈复杂度、测试覆盖率 |
|
||||
| **架构适应性挽具** | 架构特征 | 性能要求、可观测性标准、依赖方向规则 |
|
||||
| **行为挽具** | 功能正确性 | 规格说明、测试套件、端到端验证 |
|
||||
|
||||
---
|
||||
|
||||
## CAR 框架(学术界)
|
||||
|
||||
三个维度:
|
||||
- **Control(控制)** — 哪些指令保持权威
|
||||
- **Agency(智能体能力)** — 哪些行动可用
|
||||
- **Runtime(运行时)** — 状态如何延续、故障如何处理
|
||||
|
||||
提出 **Harness-sensitive** 概念:部分 Agent 性能提升可能来自 Harness 改进,而非模型本身。
|
||||
|
||||
---
|
||||
|
||||
## 实测效果(Anthropic)
|
||||
|
||||
同一模型 + 同一提示词(构建2D复古游戏编辑器):
|
||||
|
||||
| | 有Harness | 无Harness |
|
||||
|--|-----------|-----------|
|
||||
| 成本 | $9 | 更高 |
|
||||
| 时间 | 20分钟 | 更长 |
|
||||
| 结果 | 可运行 | 无法运行 |
|
||||
|
||||
**结论**:Harness 改进可能比模型本身带来的性能提升更显著。
|
||||
|
||||
---
|
||||
|
||||
## 核心启示
|
||||
|
||||
1. **Harness 是杠杆** — 同一模型,有无 Harness 结果差异巨大
|
||||
2. **验证即完成** — Agent 不能在无可运行证据的情况下宣告完成
|
||||
3. **状态持久化** — 会话间的连续性是长任务的关键
|
||||
4. **Scope 约束** — 防止 Agent 过度扩展和半途而废
|
||||
5. **渐进式披露** — 指令文件不要堆成巨型文件
|
||||
|
||||
---
|
||||
|
||||
## 与 OpenClaw 的关系
|
||||
|
||||
OpenClaw 本身就是一种 **Harness** 的实现:
|
||||
- `AGENTS.md` / `SOUL.md` / `USER.md` = Instructions 子系统
|
||||
- `MEMORY.md` / `memory/` = State 子系统
|
||||
- `HEARTBEAT.md` = Verification + Session Lifecycle
|
||||
- Skills 系统 = 工具扩展(Tool Harness)
|
||||
|
||||
Harness Engineering 理论可以指导 OpenClaw 的优化方向。
|
||||
|
||||
|
||||
@@ -1,7 +1,200 @@
|
||||
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
|
||||
<html><head>
|
||||
<title>404 Not Found</title>
|
||||
</head><body>
|
||||
<h1>Not Found</h1>
|
||||
<p>The requested URL was not found on this server.</p>
|
||||
</body></html>
|
||||
---
|
||||
title: Superpowers 技能框架
|
||||
tags:
|
||||
- AI-Agent
|
||||
- TDD
|
||||
- Coding-Agent
|
||||
- Software-Development
|
||||
- 开源
|
||||
created: 2026-04-21
|
||||
source: https://github.com/obra/superpowers
|
||||
stars: 161680
|
||||
forks: 14117
|
||||
language: Shell
|
||||
author: Jesse Vincent (obra)
|
||||
---
|
||||
|
||||
# Superpowers 技能框架
|
||||
|
||||
> 一个面向 AI 编码智能体的完整软件开发方法论
|
||||
>
|
||||
> GitHub: 161.7k ⭐ | MIT 许可证
|
||||
|
||||
## 核心定义
|
||||
|
||||
Superpowers 是由 **Jesse Vincent**(obra)开发的一套面向 AI 编码智能体的**技能框架与软件开发方法论**。
|
||||
|
||||
核心理念:**不试图让 AI"理解"最佳实践,而是构建一个"不遵守规范就无法推进"的系统**。
|
||||
|
||||
---
|
||||
|
||||
## 核心理念
|
||||
|
||||
### 与 Harness Engineering 的关系
|
||||
|
||||
Superpowers 是 Harness Engineering 的**具体实现**之一,专注于编码智能体场景。
|
||||
|
||||
| 维度 | Superpowers | Harness Engineering |
|
||||
|------|-------------|---------------------|
|
||||
| 核心等式 | 技能驱动工作流 | Agent = Model + Harness |
|
||||
| 触发机制 | 技能在任意响应前自动检查 | 五大子系统 |
|
||||
| 验证方式 | RED-GREEN-REFACTOR | verification-before-completion |
|
||||
| 状态管理 | brainstorming文档 + plan文件 | State子系统 |
|
||||
|
||||
---
|
||||
|
||||
## 核心特点
|
||||
|
||||
### 1. 技能驱动的全流程工作流
|
||||
|
||||
| 阶段 | 技能 | 说明 |
|
||||
|------|------|------|
|
||||
| 需求探索 | brainstorming | 苏格拉底式提问,输出设计文档 |
|
||||
| 工作区隔离 | using-git-worktrees | 独立Git worktree上开始工作 |
|
||||
| 任务拆解 | writing-plans | 2-5分钟细粒度任务,带文件路径和验证步骤 |
|
||||
| 执行 | subagent-driven-development / executing-plans | 子智能体并发执行,两阶段审查 |
|
||||
| 测试 | test-driven-development | 严格RED-GREEN-REFACTOR循环 |
|
||||
| 审查 | requesting-code-review | 按严重程度上报问题 |
|
||||
| 收尾 | finishing-a-development-branch | 验证测试,决策合并/PR/丢弃 |
|
||||
|
||||
### 2. 强制合规,而非依赖理解
|
||||
|
||||
技能检查置于**"任何响应或动作之前"**,从结构上杜绝跳过。
|
||||
|
||||
### 3. 心理说服原则的应用
|
||||
|
||||
基于沃顿商学院与恰尔蒂尼团队合作的论文《Call Me a Jerk: Persuading AI》:
|
||||
|
||||
- **权威(Authority)** — 技能定义为强制工作流而非建议
|
||||
- **承诺(Commitment)** — 使用技能前要求智能体公开声明
|
||||
- **社会认同(Social Proof)** — 营造"不怕调用错技能"的文化
|
||||
|
||||
### 4. 技能的TDD开发
|
||||
|
||||
技能本身也通过TDD方式创建:
|
||||
- **RED** — 设计压测场景,让子智能体执行 → 暴露技能失效
|
||||
- **GREEN** — 强化技能指令,重测通过
|
||||
- **REFACTOR** — 优化技能表达
|
||||
|
||||
### 5. 多平台支持
|
||||
|
||||
- Claude Code(官方市场)
|
||||
- OpenAI Codex CLI/App
|
||||
- GitHub Copilot CLI
|
||||
- Cursor
|
||||
- Gemini CLI
|
||||
- OpenCode
|
||||
|
||||
---
|
||||
|
||||
## 内置技能库
|
||||
|
||||
### Testing
|
||||
- **test-driven-development** — RED-GREEN-REFACTOR循环
|
||||
|
||||
### Debugging
|
||||
- **systematic-debugging** — 4阶段根因分析
|
||||
- **verification-before-completion** — 确保真正修复
|
||||
|
||||
### Collaboration
|
||||
- **brainstorming** — 苏格拉底式设计优化
|
||||
- **writing-plans** — 详细实现计划
|
||||
- **executing-plans** — 带检查点的批量执行
|
||||
- **dispatching-parallel-agents** — 并发子智能体工作流
|
||||
- **requesting-code-review** — 审查前检查清单
|
||||
- **receiving-code-review** — 响应反馈
|
||||
- **using-git-worktrees** — 并行开发分支
|
||||
- **finishing-a-development-branch** — 合并/PR决策工作流
|
||||
- **subagent-driven-development** — 两阶段审查快速迭代
|
||||
|
||||
### Meta
|
||||
- **writing-skills** — 创建新技能的最佳实践
|
||||
- **using-superpowers** — 技能系统介绍
|
||||
|
||||
---
|
||||
|
||||
## 安装方式
|
||||
|
||||
```bash
|
||||
# Claude Code 官方市场
|
||||
/plugin install superpowers@claude-plugins-official
|
||||
|
||||
# Claude Code Superpowers市场
|
||||
/plugin marketplace add obra/superpowers-marketplace
|
||||
/plugin install superpowers@superpowers-marketplace
|
||||
|
||||
# Cursor
|
||||
/add-plugin superpowers
|
||||
|
||||
# OpenAI Codex CLI
|
||||
/plugins → 搜索superpowers → 安装
|
||||
|
||||
# GitHub Copilot CLI
|
||||
copilot plugin marketplace add obra/superpowers-marketplace
|
||||
copilot plugin install superpowers@superpowers-marketplace
|
||||
|
||||
# Gemini CLI
|
||||
gemini extensions install https://github.com/obra/superpowers
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## 优势
|
||||
|
||||
| 优势 | 说明 |
|
||||
|------|------|
|
||||
| 自动化最佳实践 | 开发者无需反复提醒,框架自动触发TDD、代码审查等规范 |
|
||||
| 长时间自主运行 | 子智能体驱动开发使智能体能在数小时不偏离计划自主工作 |
|
||||
| 并行开发能力 | Git worktree + 并发子智能体可同时推进多个独立任务 |
|
||||
| 有据可查的质量保障 | verification-before-completion要求以证据代替断言 |
|
||||
| 可扩展的技能生态 | 技能以Markdown文件(SKILL.md)形式存在 |
|
||||
| 学术背书的心理机制 | 说服原则对LLM的有效性已有统计显著性的学术验证 |
|
||||
| 开源免费 | MIT许可证 |
|
||||
|
||||
---
|
||||
|
||||
## 劣势
|
||||
|
||||
| 劣势 | 说明 |
|
||||
|------|------|
|
||||
| 学习曲线 | 需要理解完整工作流,初学者上手成本较高 |
|
||||
| 流程开销 | brainstorming和planning对小型改动可能过重 |
|
||||
| 依赖智能体平台 | 技能效果高度依赖底层编码智能体 |
|
||||
| 提示词复杂度高 | 内嵌心理说服机制的提示词难以手动维护 |
|
||||
| 子智能体成本 | Subagent-Driven Development会频繁启动新实例,API成本较高 |
|
||||
| 贡献限制 | 不接受新技能的社区贡献,修改必须兼容全部支持的平台 |
|
||||
|
||||
---
|
||||
|
||||
## 适用场景
|
||||
|
||||
| 场景 | 说明 |
|
||||
|------|------|
|
||||
| 中大型功能开发 | 需求不完全清晰、任务较多时,brainstorming + writing-plans能有效防止方向跑偏 |
|
||||
| 追求工程纪律的团队 | 强制执行TDD、代码审查等规范 |
|
||||
| 长时间自主编程任务 | 需要智能体在无监督下稳定工作数小时 |
|
||||
| 多任务并行开发 | 多个独立子任务可并行推进 |
|
||||
| AI开发方法论研究 | 对"如何让AI遵守软件工程规范"感兴趣的研究者 |
|
||||
| 自定义技能开发 | 团队已有内部规范,可通过writing-skills创建专属技能 |
|
||||
|
||||
**不适合场景**:快速原型验证、一次性脚本或极简改动、对API token成本极度敏感的项目
|
||||
|
||||
---
|
||||
|
||||
## 核心启示
|
||||
|
||||
1. **强制合规 > 依赖理解** — 不让AI"理解"TDD,而是构建无法跳过的系统
|
||||
2. **技能触发在工作流之前** — 任何响应前检查技能,从结构上杜绝跳过
|
||||
3. **验证即完成** — 以证据(测试通过)代替断言("我认为完成了")
|
||||
4. **TDD for Skills** — 技能本身也需要通过压测场景来验证有效性
|
||||
5. **子智能体 + 两阶段审查** — 实现长时间自主工作的关键
|
||||
|
||||
---
|
||||
|
||||
## 参考资源
|
||||
|
||||
- **GitHub**: https://github.com/obra/superpowers
|
||||
- **官方博客**: https://blog.fsck.com/2025/10/09/superpowers/
|
||||
- **Discord社区**: https://discord.gg/35wsABTejz
|
||||
- **Claude插件市场**: https://claude.com/plugins/superpowers
|
||||
|
||||
|
||||
@@ -1,7 +1,181 @@
|
||||
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
|
||||
<html><head>
|
||||
<title>404 Not Found</title>
|
||||
</head><body>
|
||||
<h1>Not Found</h1>
|
||||
<p>The requested URL was not found on this server.</p>
|
||||
</body></html>
|
||||
---
|
||||
title: 智能体软件工程知识图谱
|
||||
tags:
|
||||
- AI-Agent
|
||||
- Agentic-SE
|
||||
- Harness-Engineering
|
||||
- Superpowers
|
||||
- 软件工程
|
||||
- 知识图谱
|
||||
created: 2026-04-21
|
||||
sources:
|
||||
- AgenticSE_Book_CN(艾哈迈德·E·哈桑,2026)
|
||||
- Harness-Engineering知识体系(11篇原始资料整理,2026-04-20)
|
||||
- Superpowers技能框架(obra,161.7k stars,2026-04-21)
|
||||
---
|
||||
|
||||
# 智能体软件工程知识图谱
|
||||
|
||||
> 串联三大框架:**Agentic SE** + **Harness Engineering** + **Superpowers**
|
||||
>
|
||||
> 核心公式:**AI Agent = Model + Harness**
|
||||
|
||||
---
|
||||
|
||||
## 一、核心共识
|
||||
|
||||
三大框架都认同:
|
||||
|
||||
1. **AI Agent = Model + Harness** — 模型提供智能,Harness 让智能可用
|
||||
2. **AI 是队友,不是工具** — 能力强大但会犯错,可靠性必须靠工程系统保障
|
||||
3. **强制合规 > 依赖理解** — 不指望 AI 自发遵守规范,要构建无法跳过的系统
|
||||
4. **验证即完成** — 以可运行的证据(测试通过)代替主观断言
|
||||
|
||||
---
|
||||
|
||||
## 二、框架定位对照
|
||||
|
||||
| 维度 | Agentic SE | Harness Engineering | Superpowers |
|
||||
|------|------------|-------------------|-------------|
|
||||
| **定位** | 学科级方法论 | 概念框架 | 具体技能实现 |
|
||||
| **层级** | 理论与哲学 | 设计原则 | 工程实践 |
|
||||
| **关注点** | 人+AI团队协作 | 除模型以外的一切 | 编码智能体工作流 |
|
||||
| **起源** | 学术(哈桑教授) | 多机构综合(LangChain/Anthropic/Thoughtworks等) | 工程实践(Jesse Vincent) |
|
||||
|
||||
---
|
||||
|
||||
## 三、核心概念映射
|
||||
|
||||
### 1. Agent = Model + Harness
|
||||
|
||||
| 组件 | Agentic SE 说法 | Harness Engineering 说法 | Superpowers 说法 |
|
||||
|------|----------------|------------------------|-----------------|
|
||||
| **Model** | AI队友 | 模型( intelligence) | 底层编码智能体 |
|
||||
| **Harness** | 工程系统保障可靠性 | 工具/指令/状态管理/验证/运行时基础设施 | 技能系统(Skills) |
|
||||
|
||||
### 2. 五大子系统(对应关系)
|
||||
|
||||
| # | Harness Engineering | Superpowers | Agentic SE |
|
||||
|---|---------------------|--------------|------------|
|
||||
| 1 | Instructions | brainstorming / writing-plans | 需求规范 + 设计文档 |
|
||||
| 2 | State | 设计文档 + plan文件 + git log | 持久化状态管理 |
|
||||
| 3 | Verification | test-driven-development / verification-before-completion | 验证与测试 |
|
||||
| 4 | Scope | one feature at a time | 任务边界控制 |
|
||||
| 5 | Session Lifecycle | init.sh / finishing-a-development-branch | 会话交接与收尾 |
|
||||
|
||||
### 3. 控制类型对照
|
||||
|
||||
| 类型 | Harness Engineering | Superpowers |
|
||||
|------|---------------------|--------------|
|
||||
| **计算型控制** | 测试/linter/类型检查 | test-driven-development |
|
||||
| **推理型控制** | LLM as Judge / AI代码审查 | requesting-code-review |
|
||||
| **前馈导引** | AGENTS.md / 技能文件 / 引导脚本 | brainstorming(苏格拉底式提问) |
|
||||
| **反馈传感** | 静态分析 / 日志 / 测试 | 两阶段审查(规格合规 + 代码质量) |
|
||||
|
||||
### 4. 质量保障维度
|
||||
|
||||
| 维度 | Harness Engineering | Superpowers |
|
||||
|------|---------------------|--------------|
|
||||
| **可维护性** | 重复代码/圈复杂度/测试覆盖率 | test-driven-development |
|
||||
| **架构适应性** | 性能/可观测性/依赖规则 | writing-plans(详细任务拆解) |
|
||||
| **行为正确性** | 规格说明/测试套件/e2e验证 | RED-GREEN-REFACTOR + verification-before-completion |
|
||||
|
||||
---
|
||||
|
||||
## 四、CAR 框架(Control-Agency-Runtime)
|
||||
|
||||
来自学术界(Harness Engineering 引用),与各框架的对应:
|
||||
|
||||
| 维度 | 定义 | 在Superpowers中的体现 |
|
||||
|------|------|---------------------|
|
||||
| **Control** | 哪些指令保持权威 | 技能触发在工作前,任何响应前检查 |
|
||||
| **Agency** | 哪些行动可用 | subagent-driven-development(子智能体执行) |
|
||||
| **Runtime** | 状态如何延续、故障如何处理 | Session Lifecycle / finishing-a-development-branch |
|
||||
|
||||
---
|
||||
|
||||
## 五、心理说服原则
|
||||
|
||||
Superpowers 独家引入(基于沃顿商学院论文《Call Me a Jerk》),可补充到 Harness Engineering:
|
||||
|
||||
| 原则 | 在Superpowers中的应用 |
|
||||
|------|----------------------|
|
||||
| **权威(Authority)** | 技能定义为强制工作流,而非建议 |
|
||||
| **承诺(Commitment)** | 使用技能前要求智能体公开声明 |
|
||||
| **社会认同(Social Proof)** | 营造"不怕调用错技能"的文化 |
|
||||
|
||||
---
|
||||
|
||||
## 六、实测效果
|
||||
|
||||
Anthropic 对比实验(同一模型 + 同一提示词):
|
||||
|
||||
| | 有Harness | 无Harness |
|
||||
|--|-----------|-----------|
|
||||
| 成本 | $9 | 更高 |
|
||||
| 时间 | 20分钟 | 更长 |
|
||||
| 结果 | 可运行 | 无法运行 |
|
||||
|
||||
**结论**:Harness 改进带来的性能提升,可能比模型本身更显著。
|
||||
|
||||
---
|
||||
|
||||
## 七、知识体系演进路径
|
||||
|
||||
```
|
||||
学术界(CAR框架)
|
||||
↓
|
||||
Harness Engineering(概念框架,11家机构综合)
|
||||
↓
|
||||
┌─────────────────┴─────────────────┐
|
||||
↓ ↓
|
||||
Agentic SE(理论专著) Superpowers(工程实践)
|
||||
(哈桑教授,2026) (Jesse Vincent,161.7k stars)
|
||||
关注:人+AI协作 关注:编码智能体工作流
|
||||
└─────────────────┬─────────────────┘
|
||||
↓
|
||||
OpenClaw/Harness实践
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## 八、对OpenClaw的指导意义
|
||||
|
||||
OpenClaw 本身就是一个 Harness 实现:
|
||||
|
||||
| OpenClaw组件 | 对应Harness子系统 |
|
||||
|-------------|-----------------|
|
||||
| AGENTS.md / SOUL.md / USER.md | Instructions |
|
||||
| MEMORY.md / memory/ | State |
|
||||
| HEARTBEAT.md | Verification + Session Lifecycle |
|
||||
| Skills系统 | 工具扩展(Tool Harness) |
|
||||
|
||||
**优化方向**:
|
||||
1. 引入 Superpowers 的"技能触发在工作前"机制
|
||||
2. 强化 verification-before-completion(当前HEARTBEAT偏简单检查)
|
||||
3. 补充前馈导引:每次会话开始时主动说明上下文
|
||||
4. 引入 TDD 思维:先定义验证方式,再执行任务
|
||||
|
||||
---
|
||||
|
||||
## 九、推荐阅读路径
|
||||
|
||||
```
|
||||
入门 → 《Agentic SE》第四部分(行动指南)
|
||||
↓
|
||||
进阶 → Harness-Engineering知识体系
|
||||
↓
|
||||
实践 → Superpowers技能框架
|
||||
↓
|
||||
落地 → OpenClaw优化方向
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## 关联文档
|
||||
|
||||
- [[Harness-Engineering知识体系]]
|
||||
- [[Superpowers技能框架]]
|
||||
- [[code-reviewer技能]]
|
||||
- [[fireworks-tech-graph技术图生成工具]]
|
||||
|
||||
|
||||
Reference in New Issue
Block a user