Update from Sync Service

2026-04-21 15:10:48 +08:00
parent 25667f6588
commit dd5f53e7d4
21 changed files with 1237 additions and 730 deletions
--- a/实践积累/AI工程/Agentic
+++ b/实践积累/AI工程/Agentic
@@ -1,7 +1,65 @@
-<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
-<html><head>
-<title>404 Not Found</title>
-</head><body>
-<h1>Not Found</h1>
-<p>The requested URL was not found on this server.</p>
-</body></html>
+---
+title: 智能体软件工程（Agentic SE）
+tags:
+  - AI-Agent
+  - 软件工程
+  - 方法论
+  - 学术
+created: 2026-04-21
+source: 艾哈迈德·E·哈桑（Ahmed E. Hassan），2026年
+translator: 李豪
+---
+
+# 智能体软件工程
+
+> 与随机性队友一起以前所未有的规模构建可信赖的软件
+
+## 关于作者
+
+**艾哈迈德·E·哈桑（Ahmed E. Hassan）教授**
+- 穆斯塔法奖得主（常比作诺贝尔级别荣誉）
+- ACM Fellow、IEEE Fellow、AAIA Fellow
+- 加拿大研究主席（Canada Research Chair）
+- 加拿大女王大学 NSERC/BlackBerry 软件工程工业研究主席
+- 全球引用次数最多的软件工程研究人员之一
+- 唯一同时获得 ACM SIGSOFT 有影响力教育家奖（2019）和 IEEE TCSE 杰出教育家奖（2020）的学者
+- 已培养出 35 位高校教授
+
+## 核心论点
+
+> **AI 不是工具，而是队友**——一个能力强大但会犯错的队友。因此，可靠性不能依赖于 AI 本身的完美，而必须通过工程系统来保障。
+
+当 AI 能以前所未有的速度生成代码时，软件工程该怎么做？
+
+## 四大部分结构
+
+| 部分 | 内容 |
+|------|------|
+| **第一部分** | 建立概念基础 |
+| **第二部分** | 解决 AI 队友的可靠性问题 |
+| **第三部分** | 将协作扩展到团队规模 |
+| **第四部分** | 为不同角色提供行动指南 |
+
+## 读书建议
+
+| 角色 | 建议 |
+|------|------|
+| 技术负责人/工程管理者 | 第一部分顺序读起，重点看第三、四部分 |
+| 一线开发者 | 第一、二部分是核心章节 |
+| 时间有限者 | 直接读第四部分（全书浓缩与行动路线图） |
+
+## 与其他框架的关系
+
+| 框架 | 关系 |
+|------|------|
+| **Harness Engineering** | Agentic SE 的第二部分对应可靠性保障 |
+| **Superpowers** | Agentic SE 的第三部分对应团队协作扩展 |
+| **Agent = Model + Harness** | 两本书共享同一核心公式 |
+
+## 译者序摘要
+
+译者李豪：
+- 这是一部从软件工程学科本身出发，严肃思考人与 AI 如何协作构建可信赖软件的著作
+- 本书提出了**智能体软件工程**这一框架
+- 核心论点：可靠性不能依赖于 AI 本身的完美，而必须通过工程系统来保障
+
--- a/实践积累/AI工程/Harness
+++ b/实践积累/AI工程/Harness
@@ -1,7 +1,129 @@
-<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
-<html><head>
-<title>404 Not Found</title>
-</head><body>
-<h1>Not Found</h1>
-<p>The requested URL was not found on this server.</p>
-</body></html>
+---
+title: Harness Engineering 知识体系
+tags:
+  - AI-Agent
+  - Engineering
+  - Prompt-Engineering
+  - Context-Engineering
+created: 2026-04-21
+source: 基于11篇原始资料整理（OpenAI/Anthropic/Thoughtworks/LangChain/HumanLayer/Inngest/学术界）
+---
+
+# Harness Engineering
+
+> AI Agent = Model + Harness
+> 
+> *"The model contains the intelligence and the harness is the system that makes that intelligence useful."* — LangChain
+
+## 核心定义
+
+**Harness** = 除模型以外的一切——工具、指令、状态管理、验证机制、运行时基础设施
+
+让模型输出从"不可靠"变成"可信赖"的工程体系。
+
+---
+
+## 各机构视角
+
+| 机构 | 侧重点 |
+|------|--------|
+| **LangChain** | 最宽泛：Harness = 一切非模型的技术层 |
+| **Anthropic** | 环境脚手架 + 长任务连续性 + clean state 理念 |
+| **OpenAI** | 代码仓库即知识系统，强调"零人工代码"自动化 |
+| **Thoughtworks** | 赛博内廷（cybernetic governor），区分"构建者挽具"vs"用户挽具" |
+| **HumanLayer** | Harness = Context Engineering 的子集，专注上下文窗口管理 |
+| **Inngest** | 持久化事件驱动基础设施 |
+| **学术界（CAR框架）** | Control + Agency + Runtime 三元框架 |
+
+---
+
+## 五大大子系统（walkinglabs 综合框架）
+
+### 1. Instructions（指令）
+告诉 Agent 做什么、按什么顺序、读什么文件。采用**渐进式披露**（Progressive Disclosure），而非巨型文件。
+
+### 2. State（状态）
+追踪已完成什么、正在做什么、接下来是什么。**持久化到磁盘**，确保会话间连续性。
+
+### 3. Verification（验证）
+只有通过测试才算完成。Agent 不能在无可运行证据的情况下宣告任务完成。
+
+### 4. Scope（范围）
+将 Agent 约束到**每次一个功能**，防止过度扩展和半途而废。
+
+### 5. Session Lifecycle（会话生命周期）
+- 开始时初始化
+- 结束时清理
+- 为下一次会话留下清晰的重启路径
+
+---
+
+## 两类控制（Thoughtworks）
+
+| 类型 | 计算型 | 推理型 |
+|------|--------|--------|
+| 执行 | CPU确定性快速 | GPU/NPU语义分析 |
+| 例子 | 测试/linter/类型检查 | LLM as Judge/AI代码审查 |
+| 特点 | 结果可靠 | 成本高但能处理语义判断 |
+
+### 前馈导引 + 反馈传感
+- **前馈导引**（Feedforward Guides）：在工作前注入上下文（AGENTS.md、技能文件、引导脚本）
+- **反馈传感**（Feedback Sensors）：工作后检测问题（静态分析、日志、测试）
+
+---
+
+## 三类调控维度（Thoughtworks）
+
+| 维度 | 调控内容 | 例子 |
+|------|----------|------|
+| **可维护性挽具** | 代码内部质量 | 重复代码、圈复杂度、测试覆盖率 |
+| **架构适应性挽具** | 架构特征 | 性能要求、可观测性标准、依赖方向规则 |
+| **行为挽具** | 功能正确性 | 规格说明、测试套件、端到端验证 |
+
+---
+
+## CAR 框架（学术界）
+
+三个维度：
+- **Control（控制）** — 哪些指令保持权威
+- **Agency（智能体能力）** — 哪些行动可用
+- **Runtime（运行时）** — 状态如何延续、故障如何处理
+
+提出 **Harness-sensitive** 概念：部分 Agent 性能提升可能来自 Harness 改进，而非模型本身。
+
+---
+
+## 实测效果（Anthropic）
+
+同一模型 + 同一提示词（构建2D复古游戏编辑器）：
+
+| | 有Harness | 无Harness |
+|--|-----------|-----------|
+| 成本 | $9 | 更高 |
+| 时间 | 20分钟 | 更长 |
+| 结果 | 可运行 | 无法运行 |
+
+**结论**：Harness 改进可能比模型本身带来的性能提升更显著。
+
+---
+
+## 核心启示
+
+1. **Harness 是杠杆** — 同一模型，有无 Harness 结果差异巨大
+2. **验证即完成** — Agent 不能在无可运行证据的情况下宣告完成
+3. **状态持久化** — 会话间的连续性是长任务的关键
+4. **Scope 约束** — 防止 Agent 过度扩展和半途而废
+5. **渐进式披露** — 指令文件不要堆成巨型文件
+
+---
+
+## 与 OpenClaw 的关系
+
+OpenClaw 本身就是一种 **Harness** 的实现：
+- `AGENTS.md` / `SOUL.md` / `USER.md` = Instructions 子系统
+- `MEMORY.md` / `memory/` = State 子系统
+- `HEARTBEAT.md` = Verification + Session Lifecycle
+- Skills 系统 = 工具扩展（Tool Harness）
+
+Harness Engineering 理论可以指导 OpenClaw 的优化方向。
+
--- a/实践积累/AI工程/Superpowers.md
+++ b/实践积累/AI工程/Superpowers.md
@@ -1,7 +1,200 @@
-<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
-<html><head>
-<title>404 Not Found</title>
-</head><body>
-<h1>Not Found</h1>
-<p>The requested URL was not found on this server.</p>
-</body></html>
+---
+title: Superpowers 技能框架
+tags:
+  - AI-Agent
+  - TDD
+  - Coding-Agent
+  - Software-Development
+  - 开源
+created: 2026-04-21
+source: https://github.com/obra/superpowers
+stars: 161680
+forks: 14117
+language: Shell
+author: Jesse Vincent (obra)
+---
+
+# Superpowers 技能框架
+
+> 一个面向 AI 编码智能体的完整软件开发方法论
+> 
+> GitHub: 161.7k ⭐ | MIT 许可证
+
+## 核心定义
+
+Superpowers 是由 **Jesse Vincent**（obra）开发的一套面向 AI 编码智能体的**技能框架与软件开发方法论**。
+
+核心理念：**不试图让 AI"理解"最佳实践，而是构建一个"不遵守规范就无法推进"的系统**。
+
+---
+
+## 核心理念
+
+### 与 Harness Engineering 的关系
+
+Superpowers 是 Harness Engineering 的**具体实现**之一，专注于编码智能体场景。
+
+| 维度 | Superpowers | Harness Engineering |
+|------|-------------|---------------------|
+| 核心等式 | 技能驱动工作流 | Agent = Model + Harness |
+| 触发机制 | 技能在任意响应前自动检查 | 五大子系统 |
+| 验证方式 | RED-GREEN-REFACTOR | verification-before-completion |
+| 状态管理 | brainstorming文档 + plan文件 | State子系统 |
+
+---
+
+## 核心特点
+
+### 1. 技能驱动的全流程工作流
+
+| 阶段 | 技能 | 说明 |
+|------|------|------|
+| 需求探索 | brainstorming | 苏格拉底式提问，输出设计文档 |
+| 工作区隔离 | using-git-worktrees | 独立Git worktree上开始工作 |
+| 任务拆解 | writing-plans | 2-5分钟细粒度任务，带文件路径和验证步骤 |
+| 执行 | subagent-driven-development / executing-plans | 子智能体并发执行，两阶段审查 |
+| 测试 | test-driven-development | 严格RED-GREEN-REFACTOR循环 |
+| 审查 | requesting-code-review | 按严重程度上报问题 |
+| 收尾 | finishing-a-development-branch | 验证测试，决策合并/PR/丢弃 |
+
+### 2. 强制合规，而非依赖理解
+
+技能检查置于**"任何响应或动作之前"**，从结构上杜绝跳过。
+
+### 3. 心理说服原则的应用
+
+基于沃顿商学院与恰尔蒂尼团队合作的论文《Call Me a Jerk: Persuading AI》：
+
+- **权威（Authority）** — 技能定义为强制工作流而非建议
+- **承诺（Commitment）** — 使用技能前要求智能体公开声明
+- **社会认同（Social Proof）** — 营造"不怕调用错技能"的文化
+
+### 4. 技能的TDD开发
+
+技能本身也通过TDD方式创建：
+- **RED** — 设计压测场景，让子智能体执行 → 暴露技能失效
+- **GREEN** — 强化技能指令，重测通过
+- **REFACTOR** — 优化技能表达
+
+### 5. 多平台支持
+
+- Claude Code（官方市场）
+- OpenAI Codex CLI/App
+- GitHub Copilot CLI
+- Cursor
+- Gemini CLI
+- OpenCode
+
+---
+
+## 内置技能库
+
+### Testing
+- **test-driven-development** — RED-GREEN-REFACTOR循环
+
+### Debugging
+- **systematic-debugging** — 4阶段根因分析
+- **verification-before-completion** — 确保真正修复
+
+### Collaboration
+- **brainstorming** — 苏格拉底式设计优化
+- **writing-plans** — 详细实现计划
+- **executing-plans** — 带检查点的批量执行
+- **dispatching-parallel-agents** — 并发子智能体工作流
+- **requesting-code-review** — 审查前检查清单
+- **receiving-code-review** — 响应反馈
+- **using-git-worktrees** — 并行开发分支
+- **finishing-a-development-branch** — 合并/PR决策工作流
+- **subagent-driven-development** — 两阶段审查快速迭代
+
+### Meta
+- **writing-skills** — 创建新技能的最佳实践
+- **using-superpowers** — 技能系统介绍
+
+---
+
+## 安装方式
+
+```bash
+# Claude Code 官方市场
+/plugin install superpowers@claude-plugins-official
+
+# Claude Code Superpowers市场
+/plugin marketplace add obra/superpowers-marketplace
+/plugin install superpowers@superpowers-marketplace
+
+# Cursor
+/add-plugin superpowers
+
+# OpenAI Codex CLI
+/plugins → 搜索superpowers → 安装
+
+# GitHub Copilot CLI
+copilot plugin marketplace add obra/superpowers-marketplace
+copilot plugin install superpowers@superpowers-marketplace
+
+# Gemini CLI
+gemini extensions install https://github.com/obra/superpowers
+```
+
+---
+
+## 优势
+
+| 优势 | 说明 |
+|------|------|
+| 自动化最佳实践 | 开发者无需反复提醒，框架自动触发TDD、代码审查等规范 |
+| 长时间自主运行 | 子智能体驱动开发使智能体能在数小时不偏离计划自主工作 |
+| 并行开发能力 | Git worktree + 并发子智能体可同时推进多个独立任务 |
+| 有据可查的质量保障 | verification-before-completion要求以证据代替断言 |
+| 可扩展的技能生态 | 技能以Markdown文件（SKILL.md）形式存在 |
+| 学术背书的心理机制 | 说服原则对LLM的有效性已有统计显著性的学术验证 |
+| 开源免费 | MIT许可证 |
+
+---
+
+## 劣势
+
+| 劣势 | 说明 |
+|------|------|
+| 学习曲线 | 需要理解完整工作流，初学者上手成本较高 |
+| 流程开销 | brainstorming和planning对小型改动可能过重 |
+| 依赖智能体平台 | 技能效果高度依赖底层编码智能体 |
+| 提示词复杂度高 | 内嵌心理说服机制的提示词难以手动维护 |
+| 子智能体成本 | Subagent-Driven Development会频繁启动新实例，API成本较高 |
+| 贡献限制 | 不接受新技能的社区贡献，修改必须兼容全部支持的平台 |
+
+---
+
+## 适用场景
+
+| 场景 | 说明 |
+|------|------|
+| 中大型功能开发 | 需求不完全清晰、任务较多时，brainstorming + writing-plans能有效防止方向跑偏 |
+| 追求工程纪律的团队 | 强制执行TDD、代码审查等规范 |
+| 长时间自主编程任务 | 需要智能体在无监督下稳定工作数小时 |
+| 多任务并行开发 | 多个独立子任务可并行推进 |
+| AI开发方法论研究 | 对"如何让AI遵守软件工程规范"感兴趣的研究者 |
+| 自定义技能开发 | 团队已有内部规范，可通过writing-skills创建专属技能 |
+
+**不适合场景**：快速原型验证、一次性脚本或极简改动、对API token成本极度敏感的项目
+
+---
+
+## 核心启示
+
+1. **强制合规 > 依赖理解** — 不让AI"理解"TDD，而是构建无法跳过的系统
+2. **技能触发在工作流之前** — 任何响应前检查技能，从结构上杜绝跳过
+3. **验证即完成** — 以证据（测试通过）代替断言（"我认为完成了"）
+4. **TDD for Skills** — 技能本身也需要通过压测场景来验证有效性
+5. **子智能体 + 两阶段审查** — 实现长时间自主工作的关键
+
+---
+
+## 参考资源
+
+- **GitHub**: https://github.com/obra/superpowers
+- **官方博客**: https://blog.fsck.com/2025/10/09/superpowers/
+- **Discord社区**: https://discord.gg/35wsABTejz
+- **Claude插件市场**: https://claude.com/plugins/superpowers
+
--- a/实践积累/AI工程/智能体软件工程知识图谱.md
+++ b/实践积累/AI工程/智能体软件工程知识图谱.md
@@ -1,7 +1,181 @@
-<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
-<html><head>
-<title>404 Not Found</title>
-</head><body>
-<h1>Not Found</h1>
-<p>The requested URL was not found on this server.</p>
-</body></html>
+---
+title: 智能体软件工程知识图谱
+tags:
+  - AI-Agent
+  - Agentic-SE
+  - Harness-Engineering
+  - Superpowers
+  - 软件工程
+  - 知识图谱
+created: 2026-04-21
+sources:
+  - AgenticSE_Book_CN（艾哈迈德·E·哈桑，2026）
+  - Harness-Engineering知识体系（11篇原始资料整理，2026-04-20）
+  - Superpowers技能框架（obra，161.7k stars，2026-04-21）
+---
+
+# 智能体软件工程知识图谱
+
+> 串联三大框架：**Agentic SE** + **Harness Engineering** + **Superpowers**
+> 
+> 核心公式：**AI Agent = Model + Harness**
+
+---
+
+## 一、核心共识
+
+三大框架都认同：
+
+1. **AI Agent = Model + Harness** — 模型提供智能，Harness 让智能可用
+2. **AI 是队友，不是工具** — 能力强大但会犯错，可靠性必须靠工程系统保障
+3. **强制合规 > 依赖理解** — 不指望 AI 自发遵守规范，要构建无法跳过的系统
+4. **验证即完成** — 以可运行的证据（测试通过）代替主观断言
+
+---
+
+## 二、框架定位对照
+
+| 维度 | Agentic SE | Harness Engineering | Superpowers |
+|------|------------|-------------------|-------------|
+| **定位** | 学科级方法论 | 概念框架 | 具体技能实现 |
+| **层级** | 理论与哲学 | 设计原则 | 工程实践 |
+| **关注点** | 人+AI团队协作 | 除模型以外的一切 | 编码智能体工作流 |
+| **起源** | 学术（哈桑教授） | 多机构综合（LangChain/Anthropic/Thoughtworks等） | 工程实践（Jesse Vincent） |
+
+---
+
+## 三、核心概念映射
+
+### 1. Agent = Model + Harness
+
+| 组件 | Agentic SE 说法 | Harness Engineering 说法 | Superpowers 说法 |
+|------|----------------|------------------------|-----------------|
+| **Model** | AI队友 | 模型（ intelligence） | 底层编码智能体 |
+| **Harness** | 工程系统保障可靠性 | 工具/指令/状态管理/验证/运行时基础设施 | 技能系统（Skills） |
+
+### 2. 五大子系统（对应关系）
+
+| # | Harness Engineering | Superpowers | Agentic SE |
+|---|---------------------|--------------|------------|
+| 1 | Instructions | brainstorming / writing-plans | 需求规范 + 设计文档 |
+| 2 | State | 设计文档 + plan文件 + git log | 持久化状态管理 |
+| 3 | Verification | test-driven-development / verification-before-completion | 验证与测试 |
+| 4 | Scope | one feature at a time | 任务边界控制 |
+| 5 | Session Lifecycle | init.sh / finishing-a-development-branch | 会话交接与收尾 |
+
+### 3. 控制类型对照
+
+| 类型 | Harness Engineering | Superpowers |
+|------|---------------------|--------------|
+| **计算型控制** | 测试/linter/类型检查 | test-driven-development |
+| **推理型控制** | LLM as Judge / AI代码审查 | requesting-code-review |
+| **前馈导引** | AGENTS.md / 技能文件 / 引导脚本 | brainstorming（苏格拉底式提问） |
+| **反馈传感** | 静态分析 / 日志 / 测试 | 两阶段审查（规格合规 + 代码质量） |
+
+### 4. 质量保障维度
+
+| 维度 | Harness Engineering | Superpowers |
+|------|---------------------|--------------|
+| **可维护性** | 重复代码/圈复杂度/测试覆盖率 | test-driven-development |
+| **架构适应性** | 性能/可观测性/依赖规则 | writing-plans（详细任务拆解） |
+| **行为正确性** | 规格说明/测试套件/e2e验证 | RED-GREEN-REFACTOR + verification-before-completion |
+
+---
+
+## 四、CAR 框架（Control-Agency-Runtime）
+
+来自学术界（Harness Engineering 引用），与各框架的对应：
+
+| 维度 | 定义 | 在Superpowers中的体现 |
+|------|------|---------------------|
+| **Control** | 哪些指令保持权威 | 技能触发在工作前，任何响应前检查 |
+| **Agency** | 哪些行动可用 | subagent-driven-development（子智能体执行） |
+| **Runtime** | 状态如何延续、故障如何处理 | Session Lifecycle / finishing-a-development-branch |
+
+---
+
+## 五、心理说服原则
+
+Superpowers 独家引入（基于沃顿商学院论文《Call Me a Jerk》），可补充到 Harness Engineering：
+
+| 原则 | 在Superpowers中的应用 |
+|------|----------------------|
+| **权威（Authority）** | 技能定义为强制工作流，而非建议 |
+| **承诺（Commitment）** | 使用技能前要求智能体公开声明 |
+| **社会认同（Social Proof）** | 营造"不怕调用错技能"的文化 |
+
+---
+
+## 六、实测效果
+
+Anthropic 对比实验（同一模型 + 同一提示词）：
+
+| | 有Harness | 无Harness |
+|--|-----------|-----------|
+| 成本 | $9 | 更高 |
+| 时间 | 20分钟 | 更长 |
+| 结果 | 可运行 | 无法运行 |
+
+**结论**：Harness 改进带来的性能提升，可能比模型本身更显著。
+
+---
+
+## 七、知识体系演进路径
+
+```
+学术界（CAR框架）
+    ↓
+Harness Engineering（概念框架，11家机构综合）
+    ↓
+┌─────────────────┴─────────────────┐
+↓                                     ↓
+Agentic SE（理论专著）       Superpowers（工程实践）
+（哈桑教授，2026）          （Jesse Vincent，161.7k stars）
+关注：人+AI协作             关注：编码智能体工作流
+└─────────────────┬─────────────────┘
+                  ↓
+         OpenClaw/Harness实践
+```
+
+---
+
+## 八、对OpenClaw的指导意义
+
+OpenClaw 本身就是一个 Harness 实现：
+
+| OpenClaw组件 | 对应Harness子系统 |
+|-------------|-----------------|
+| AGENTS.md / SOUL.md / USER.md | Instructions |
+| MEMORY.md / memory/ | State |
+| HEARTBEAT.md | Verification + Session Lifecycle |
+| Skills系统 | 工具扩展（Tool Harness） |
+
+**优化方向**：
+1. 引入 Superpowers 的"技能触发在工作前"机制
+2. 强化 verification-before-completion（当前HEARTBEAT偏简单检查）
+3. 补充前馈导引：每次会话开始时主动说明上下文
+4. 引入 TDD 思维：先定义验证方式，再执行任务
+
+---
+
+## 九、推荐阅读路径
+
+```
+入门 → 《Agentic SE》第四部分（行动指南）
+      ↓
+进阶 → Harness-Engineering知识体系
+      ↓
+实践 → Superpowers技能框架
+      ↓
+落地 → OpenClaw优化方向
+```
+
+---
+
+## 关联文档
+
+- [[Harness-Engineering知识体系]]
+- [[Superpowers技能框架]]
+- [[code-reviewer技能]]
+- [[fireworks-tech-graph技术图生成工具]]
+