Update from Sync Service

This commit is contained in:
FNS Service
2026-04-21 17:13:51 +08:00
parent 1cf8b7895b
commit c160565270
578 changed files with 0 additions and 17669 deletions

View File

@@ -1,65 +0,0 @@
---
title: 智能体软件工程Agentic SE
tags:
- AI-Agent
- 软件工程
- 方法论
- 学术
created: 2026-04-21
source: 艾哈迈德·E·哈桑Ahmed E. Hassan2026年
translator: 李豪
---
# 智能体软件工程
> 与随机性队友一起以前所未有的规模构建可信赖的软件
## 关于作者
**艾哈迈德·E·哈桑Ahmed E. Hassan教授**
- 穆斯塔法奖得主(常比作诺贝尔级别荣誉)
- ACM Fellow、IEEE Fellow、AAIA Fellow
- 加拿大研究主席Canada Research Chair
- 加拿大女王大学 NSERC/BlackBerry 软件工程工业研究主席
- 全球引用次数最多的软件工程研究人员之一
- 唯一同时获得 ACM SIGSOFT 有影响力教育家奖2019和 IEEE TCSE 杰出教育家奖2020的学者
- 已培养出 35 位高校教授
## 核心论点
> **AI 不是工具,而是队友**——一个能力强大但会犯错的队友。因此,可靠性不能依赖于 AI 本身的完美,而必须通过工程系统来保障。
当 AI 能以前所未有的速度生成代码时,软件工程该怎么做?
## 四大部分结构
| 部分 | 内容 |
|------|------|
| **第一部分** | 建立概念基础 |
| **第二部分** | 解决 AI 队友的可靠性问题 |
| **第三部分** | 将协作扩展到团队规模 |
| **第四部分** | 为不同角色提供行动指南 |
## 读书建议
| 角色 | 建议 |
|------|------|
| 技术负责人/工程管理者 | 第一部分顺序读起,重点看第三、四部分 |
| 一线开发者 | 第一、二部分是核心章节 |
| 时间有限者 | 直接读第四部分(全书浓缩与行动路线图) |
## 与其他框架的关系
| 框架 | 关系 |
|------|------|
| **Harness Engineering** | Agentic SE 的第二部分对应可靠性保障 |
| **Superpowers** | Agentic SE 的第三部分对应团队协作扩展 |
| **Agent = Model + Harness** | 两本书共享同一核心公式 |
## 译者序摘要
译者李豪:
- 这是一部从软件工程学科本身出发,严肃思考人与 AI 如何协作构建可信赖软件的著作
- 本书提出了**智能体软件工程**这一框架
- 核心论点:可靠性不能依赖于 AI 本身的完美,而必须通过工程系统来保障

View File

@@ -1,129 +0,0 @@
---
title: Harness Engineering 知识体系
tags:
- AI-Agent
- Engineering
- Prompt-Engineering
- Context-Engineering
created: 2026-04-21
source: 基于11篇原始资料整理OpenAI/Anthropic/Thoughtworks/LangChain/HumanLayer/Inngest/学术界)
---
# Harness Engineering
> AI Agent = Model + Harness
>
> *"The model contains the intelligence and the harness is the system that makes that intelligence useful."* — LangChain
## 核心定义
**Harness** = 除模型以外的一切——工具、指令、状态管理、验证机制、运行时基础设施
让模型输出从"不可靠"变成"可信赖"的工程体系。
---
## 各机构视角
| 机构 | 侧重点 |
|------|--------|
| **LangChain** | 最宽泛Harness = 一切非模型的技术层 |
| **Anthropic** | 环境脚手架 + 长任务连续性 + clean state 理念 |
| **OpenAI** | 代码仓库即知识系统,强调"零人工代码"自动化 |
| **Thoughtworks** | 赛博内廷cybernetic governor区分"构建者挽具"vs"用户挽具" |
| **HumanLayer** | Harness = Context Engineering 的子集,专注上下文窗口管理 |
| **Inngest** | 持久化事件驱动基础设施 |
| **学术界CAR框架** | Control + Agency + Runtime 三元框架 |
---
## 五大大子系统walkinglabs 综合框架)
### 1. Instructions指令
告诉 Agent 做什么、按什么顺序、读什么文件。采用**渐进式披露**Progressive Disclosure而非巨型文件。
### 2. State状态
追踪已完成什么、正在做什么、接下来是什么。**持久化到磁盘**,确保会话间连续性。
### 3. Verification验证
只有通过测试才算完成。Agent 不能在无可运行证据的情况下宣告任务完成。
### 4. Scope范围
将 Agent 约束到**每次一个功能**,防止过度扩展和半途而废。
### 5. Session Lifecycle会话生命周期
- 开始时初始化
- 结束时清理
- 为下一次会话留下清晰的重启路径
---
## 两类控制Thoughtworks
| 类型 | 计算型 | 推理型 |
|------|--------|--------|
| 执行 | CPU确定性快速 | GPU/NPU语义分析 |
| 例子 | 测试/linter/类型检查 | LLM as Judge/AI代码审查 |
| 特点 | 结果可靠 | 成本高但能处理语义判断 |
### 前馈导引 + 反馈传感
- **前馈导引**Feedforward Guides在工作前注入上下文AGENTS.md、技能文件、引导脚本
- **反馈传感**Feedback Sensors工作后检测问题静态分析、日志、测试
---
## 三类调控维度Thoughtworks
| 维度 | 调控内容 | 例子 |
|------|----------|------|
| **可维护性挽具** | 代码内部质量 | 重复代码、圈复杂度、测试覆盖率 |
| **架构适应性挽具** | 架构特征 | 性能要求、可观测性标准、依赖方向规则 |
| **行为挽具** | 功能正确性 | 规格说明、测试套件、端到端验证 |
---
## CAR 框架(学术界)
三个维度:
- **Control控制** — 哪些指令保持权威
- **Agency智能体能力** — 哪些行动可用
- **Runtime运行时** — 状态如何延续、故障如何处理
提出 **Harness-sensitive** 概念:部分 Agent 性能提升可能来自 Harness 改进,而非模型本身。
---
## 实测效果Anthropic
同一模型 + 同一提示词构建2D复古游戏编辑器
| | 有Harness | 无Harness |
|--|-----------|-----------|
| 成本 | $9 | 更高 |
| 时间 | 20分钟 | 更长 |
| 结果 | 可运行 | 无法运行 |
**结论**Harness 改进可能比模型本身带来的性能提升更显著。
---
## 核心启示
1. **Harness 是杠杆** — 同一模型,有无 Harness 结果差异巨大
2. **验证即完成** — Agent 不能在无可运行证据的情况下宣告完成
3. **状态持久化** — 会话间的连续性是长任务的关键
4. **Scope 约束** — 防止 Agent 过度扩展和半途而废
5. **渐进式披露** — 指令文件不要堆成巨型文件
---
## 与 OpenClaw 的关系
OpenClaw 本身就是一种 **Harness** 的实现:
- `AGENTS.md` / `SOUL.md` / `USER.md` = Instructions 子系统
- `MEMORY.md` / `memory/` = State 子系统
- `HEARTBEAT.md` = Verification + Session Lifecycle
- Skills 系统 = 工具扩展Tool Harness
Harness Engineering 理论可以指导 OpenClaw 的优化方向。

View File

@@ -1,200 +0,0 @@
---
title: Superpowers 技能框架
tags:
- AI-Agent
- TDD
- Coding-Agent
- Software-Development
- 开源
created: 2026-04-21
source: https://github.com/obra/superpowers
stars: 161680
forks: 14117
language: Shell
author: Jesse Vincent (obra)
---
# Superpowers 技能框架
> 一个面向 AI 编码智能体的完整软件开发方法论
>
> GitHub: 161.7k ⭐ | MIT 许可证
## 核心定义
Superpowers 是由 **Jesse Vincent**obra开发的一套面向 AI 编码智能体的**技能框架与软件开发方法论**。
核心理念:**不试图让 AI"理解"最佳实践,而是构建一个"不遵守规范就无法推进"的系统**。
---
## 核心理念
### 与 Harness Engineering 的关系
Superpowers 是 Harness Engineering 的**具体实现**之一,专注于编码智能体场景。
| 维度 | Superpowers | Harness Engineering |
|------|-------------|---------------------|
| 核心等式 | 技能驱动工作流 | Agent = Model + Harness |
| 触发机制 | 技能在任意响应前自动检查 | 五大子系统 |
| 验证方式 | RED-GREEN-REFACTOR | verification-before-completion |
| 状态管理 | brainstorming文档 + plan文件 | State子系统 |
---
## 核心特点
### 1. 技能驱动的全流程工作流
| 阶段 | 技能 | 说明 |
|------|------|------|
| 需求探索 | brainstorming | 苏格拉底式提问,输出设计文档 |
| 工作区隔离 | using-git-worktrees | 独立Git worktree上开始工作 |
| 任务拆解 | writing-plans | 2-5分钟细粒度任务带文件路径和验证步骤 |
| 执行 | subagent-driven-development / executing-plans | 子智能体并发执行,两阶段审查 |
| 测试 | test-driven-development | 严格RED-GREEN-REFACTOR循环 |
| 审查 | requesting-code-review | 按严重程度上报问题 |
| 收尾 | finishing-a-development-branch | 验证测试,决策合并/PR/丢弃 |
### 2. 强制合规,而非依赖理解
技能检查置于**"任何响应或动作之前"**,从结构上杜绝跳过。
### 3. 心理说服原则的应用
基于沃顿商学院与恰尔蒂尼团队合作的论文《Call Me a Jerk: Persuading AI》
- **权威Authority** — 技能定义为强制工作流而非建议
- **承诺Commitment** — 使用技能前要求智能体公开声明
- **社会认同Social Proof** — 营造"不怕调用错技能"的文化
### 4. 技能的TDD开发
技能本身也通过TDD方式创建
- **RED** — 设计压测场景,让子智能体执行 → 暴露技能失效
- **GREEN** — 强化技能指令,重测通过
- **REFACTOR** — 优化技能表达
### 5. 多平台支持
- Claude Code官方市场
- OpenAI Codex CLI/App
- GitHub Copilot CLI
- Cursor
- Gemini CLI
- OpenCode
---
## 内置技能库
### Testing
- **test-driven-development** — RED-GREEN-REFACTOR循环
### Debugging
- **systematic-debugging** — 4阶段根因分析
- **verification-before-completion** — 确保真正修复
### Collaboration
- **brainstorming** — 苏格拉底式设计优化
- **writing-plans** — 详细实现计划
- **executing-plans** — 带检查点的批量执行
- **dispatching-parallel-agents** — 并发子智能体工作流
- **requesting-code-review** — 审查前检查清单
- **receiving-code-review** — 响应反馈
- **using-git-worktrees** — 并行开发分支
- **finishing-a-development-branch** — 合并/PR决策工作流
- **subagent-driven-development** — 两阶段审查快速迭代
### Meta
- **writing-skills** — 创建新技能的最佳实践
- **using-superpowers** — 技能系统介绍
---
## 安装方式
```bash
# Claude Code 官方市场
/plugin install superpowers@claude-plugins-official
# Claude Code Superpowers市场
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace
# Cursor
/add-plugin superpowers
# OpenAI Codex CLI
/plugins → 搜索superpowers → 安装
# GitHub Copilot CLI
copilot plugin marketplace add obra/superpowers-marketplace
copilot plugin install superpowers@superpowers-marketplace
# Gemini CLI
gemini extensions install https://github.com/obra/superpowers
```
---
## 优势
| 优势 | 说明 |
|------|------|
| 自动化最佳实践 | 开发者无需反复提醒框架自动触发TDD、代码审查等规范 |
| 长时间自主运行 | 子智能体驱动开发使智能体能在数小时不偏离计划自主工作 |
| 并行开发能力 | Git worktree + 并发子智能体可同时推进多个独立任务 |
| 有据可查的质量保障 | verification-before-completion要求以证据代替断言 |
| 可扩展的技能生态 | 技能以Markdown文件SKILL.md形式存在 |
| 学术背书的心理机制 | 说服原则对LLM的有效性已有统计显著性的学术验证 |
| 开源免费 | MIT许可证 |
---
## 劣势
| 劣势 | 说明 |
|------|------|
| 学习曲线 | 需要理解完整工作流,初学者上手成本较高 |
| 流程开销 | brainstorming和planning对小型改动可能过重 |
| 依赖智能体平台 | 技能效果高度依赖底层编码智能体 |
| 提示词复杂度高 | 内嵌心理说服机制的提示词难以手动维护 |
| 子智能体成本 | Subagent-Driven Development会频繁启动新实例API成本较高 |
| 贡献限制 | 不接受新技能的社区贡献,修改必须兼容全部支持的平台 |
---
## 适用场景
| 场景 | 说明 |
|------|------|
| 中大型功能开发 | 需求不完全清晰、任务较多时brainstorming + writing-plans能有效防止方向跑偏 |
| 追求工程纪律的团队 | 强制执行TDD、代码审查等规范 |
| 长时间自主编程任务 | 需要智能体在无监督下稳定工作数小时 |
| 多任务并行开发 | 多个独立子任务可并行推进 |
| AI开发方法论研究 | 对"如何让AI遵守软件工程规范"感兴趣的研究者 |
| 自定义技能开发 | 团队已有内部规范可通过writing-skills创建专属技能 |
**不适合场景**快速原型验证、一次性脚本或极简改动、对API token成本极度敏感的项目
---
## 核心启示
1. **强制合规 > 依赖理解** — 不让AI"理解"TDD而是构建无法跳过的系统
2. **技能触发在工作流之前** — 任何响应前检查技能,从结构上杜绝跳过
3. **验证即完成** — 以证据(测试通过)代替断言("我认为完成了"
4. **TDD for Skills** — 技能本身也需要通过压测场景来验证有效性
5. **子智能体 + 两阶段审查** — 实现长时间自主工作的关键
---
## 参考资源
- **GitHub**: https://github.com/obra/superpowers
- **官方博客**: https://blog.fsck.com/2025/10/09/superpowers/
- **Discord社区**: https://discord.gg/35wsABTejz
- **Claude插件市场**: https://claude.com/plugins/superpowers

View File

@@ -1,181 +0,0 @@
---
title: 智能体软件工程知识图谱
tags:
- AI-Agent
- Agentic-SE
- Harness-Engineering
- Superpowers
- 软件工程
- 知识图谱
created: 2026-04-21
sources:
- AgenticSE_Book_CN艾哈迈德·E·哈桑2026
- Harness-Engineering知识体系11篇原始资料整理2026-04-20
- Superpowers技能框架obra161.7k stars2026-04-21
---
# 智能体软件工程知识图谱
> 串联三大框架:**Agentic SE** + **Harness Engineering** + **Superpowers**
>
> 核心公式:**AI Agent = Model + Harness**
---
## 一、核心共识
三大框架都认同:
1. **AI Agent = Model + Harness** — 模型提供智能Harness 让智能可用
2. **AI 是队友,不是工具** — 能力强大但会犯错,可靠性必须靠工程系统保障
3. **强制合规 > 依赖理解** — 不指望 AI 自发遵守规范,要构建无法跳过的系统
4. **验证即完成** — 以可运行的证据(测试通过)代替主观断言
---
## 二、框架定位对照
| 维度 | Agentic SE | Harness Engineering | Superpowers |
|------|------------|-------------------|-------------|
| **定位** | 学科级方法论 | 概念框架 | 具体技能实现 |
| **层级** | 理论与哲学 | 设计原则 | 工程实践 |
| **关注点** | 人+AI团队协作 | 除模型以外的一切 | 编码智能体工作流 |
| **起源** | 学术(哈桑教授) | 多机构综合LangChain/Anthropic/Thoughtworks等 | 工程实践Jesse Vincent |
---
## 三、核心概念映射
### 1. Agent = Model + Harness
| 组件 | Agentic SE 说法 | Harness Engineering 说法 | Superpowers 说法 |
|------|----------------|------------------------|-----------------|
| **Model** | AI队友 | 模型( intelligence | 底层编码智能体 |
| **Harness** | 工程系统保障可靠性 | 工具/指令/状态管理/验证/运行时基础设施 | 技能系统Skills |
### 2. 五大子系统(对应关系)
| # | Harness Engineering | Superpowers | Agentic SE |
|---|---------------------|--------------|------------|
| 1 | Instructions | brainstorming / writing-plans | 需求规范 + 设计文档 |
| 2 | State | 设计文档 + plan文件 + git log | 持久化状态管理 |
| 3 | Verification | test-driven-development / verification-before-completion | 验证与测试 |
| 4 | Scope | one feature at a time | 任务边界控制 |
| 5 | Session Lifecycle | init.sh / finishing-a-development-branch | 会话交接与收尾 |
### 3. 控制类型对照
| 类型 | Harness Engineering | Superpowers |
|------|---------------------|--------------|
| **计算型控制** | 测试/linter/类型检查 | test-driven-development |
| **推理型控制** | LLM as Judge / AI代码审查 | requesting-code-review |
| **前馈导引** | AGENTS.md / 技能文件 / 引导脚本 | brainstorming苏格拉底式提问 |
| **反馈传感** | 静态分析 / 日志 / 测试 | 两阶段审查(规格合规 + 代码质量) |
### 4. 质量保障维度
| 维度 | Harness Engineering | Superpowers |
|------|---------------------|--------------|
| **可维护性** | 重复代码/圈复杂度/测试覆盖率 | test-driven-development |
| **架构适应性** | 性能/可观测性/依赖规则 | writing-plans详细任务拆解 |
| **行为正确性** | 规格说明/测试套件/e2e验证 | RED-GREEN-REFACTOR + verification-before-completion |
---
## 四、CAR 框架Control-Agency-Runtime
来自学术界Harness Engineering 引用),与各框架的对应:
| 维度 | 定义 | 在Superpowers中的体现 |
|------|------|---------------------|
| **Control** | 哪些指令保持权威 | 技能触发在工作前,任何响应前检查 |
| **Agency** | 哪些行动可用 | subagent-driven-development子智能体执行 |
| **Runtime** | 状态如何延续、故障如何处理 | Session Lifecycle / finishing-a-development-branch |
---
## 五、心理说服原则
Superpowers 独家引入基于沃顿商学院论文《Call Me a Jerk》可补充到 Harness Engineering
| 原则 | 在Superpowers中的应用 |
|------|----------------------|
| **权威Authority** | 技能定义为强制工作流,而非建议 |
| **承诺Commitment** | 使用技能前要求智能体公开声明 |
| **社会认同Social Proof** | 营造"不怕调用错技能"的文化 |
---
## 六、实测效果
Anthropic 对比实验(同一模型 + 同一提示词):
| | 有Harness | 无Harness |
|--|-----------|-----------|
| 成本 | $9 | 更高 |
| 时间 | 20分钟 | 更长 |
| 结果 | 可运行 | 无法运行 |
**结论**Harness 改进带来的性能提升,可能比模型本身更显著。
---
## 七、知识体系演进路径
```
学术界CAR框架
Harness Engineering概念框架11家机构综合
┌─────────────────┴─────────────────┐
↓ ↓
Agentic SE理论专著 Superpowers工程实践
哈桑教授2026 Jesse Vincent161.7k stars
关注:人+AI协作 关注:编码智能体工作流
└─────────────────┬─────────────────┘
OpenClaw/Harness实践
```
---
## 八、对OpenClaw的指导意义
OpenClaw 本身就是一个 Harness 实现:
| OpenClaw组件 | 对应Harness子系统 |
|-------------|-----------------|
| AGENTS.md / SOUL.md / USER.md | Instructions |
| MEMORY.md / memory/ | State |
| HEARTBEAT.md | Verification + Session Lifecycle |
| Skills系统 | 工具扩展Tool Harness |
**优化方向**
1. 引入 Superpowers 的"技能触发在工作前"机制
2. 强化 verification-before-completion当前HEARTBEAT偏简单检查
3. 补充前馈导引:每次会话开始时主动说明上下文
4. 引入 TDD 思维:先定义验证方式,再执行任务
---
## 九、推荐阅读路径
```
入门 → 《Agentic SE》第四部分行动指南
进阶 → Harness-Engineering知识体系
实践 → Superpowers技能框架
落地 → OpenClaw优化方向
```
---
## 关联文档
- [[Harness-Engineering知识体系]]
- [[Superpowers技能框架]]
- [[code-reviewer技能]]
- [[fireworks-tech-graph技术图生成工具]]