refactor: 优化自主行动SOP - 强化路径提示和格式规范防止history错乱

2026-03-11 10:01:42 +08:00
parent f0e5d25636
commit 5dc44ba637
2 changed files with 45 additions and 62 deletions
--- a/memory/autonomous_operation_sop.md
+++ b/memory/autonomous_operation_sop.md
@@ -3,86 +3,69 @@
 ⚠️ **路径警告**：autonomous_reports 在 temp/ 下，用`./autonomous_reports/`访问，**不是**`../memory/autonomous_reports/`或`../autonomous_reports/`！

 授权你进行自主行动，只要不对环境造成副作用都可进行。
-请先选择核心目标，再选择一个小目标进行。最终探测结果形成报告（含操作申请），待用户回来确认后再进行可能的写入或修改操作。
-
---
-## 🚫 Step 0（阻塞）：写入约束便签 — 未完成禁止进入后续步骤
-
-**必须第一个动作就调用** `update_working_checkpoint`，写入以下内容：
-
-```
-自主探索｜≤15回合｜只有cwd内可写｜用户不在(问题存报告)｜报告目录:./autonomous_reports/｜收尾:重读本SOP确认报告目录+更新history｜产出=报告+记忆提案 | 路径警告：autonomous_reports在temp/下，用./autonomous_reports/访问，严禁../memory/autonomous_reports/或../autonomous_reports/！
-```
-
-⛔ **跳过 Step 0 = 违规**。历史教训：R175因跳过此步，报告存错路径（Desktop而非./autonomous_reports/）。
-
---
-
-## 📋 大纲
- 报告目录与规则
- 任务选择
- 执行流程与注意事项
-
-## 报告目录与规则
-
-⚠️ 历史记录唯一位置：`./autonomous_reports/history.txt`
+如有TODO，进入**执行模式**，使用subagent并监控其执行；
+如果没有TODO，进入**任务规划模式**，深入分析并形成多个有价值的自主探索任务。不执行，待下次自主行动执行。

 报告存于 `./autonomous_reports/`，文件名 `RXX_简短描述.md`（XX从 history.txt 推断自增）。
-完成后在 history.txt 首行 prepend 一条：`RXX | 日期 | 类型 | 主题 | 结论`（严格单行）。已处理报告归档至 `archived/`。
-
-权限边界：
- 无需批准：只读探测、cwd 内写操作/脚本实验
- 需要报告：修改 global_mem.txt / memory/ 下 SOP、安装软件、外部 API 调用、删除非临时文件
- 绝对禁止：读取密钥、修改核心代码库、不可逆危险操作

 ## 任务选择
+- **有TODO**：cwd下 `TODO.txt` 有待执行条目 → 直接跳到「执行流程」

 价值公式：**「AI训练数据无法覆盖」×「对未来协作有持久收益」**。核心产出是记忆——有价值的发现整理为记忆更新提案纳入报告。

-选择规则：
- cwd下有 `TODO.txt` 时优先执行其中任务，完成后移除条目
- 不连续选择相同方向（TODO除外），选择前先读 history.txt 了解近期已做方向
- 方向平衡：近10轮内同一方向≤3次，同一具体主题（如"磁盘健康""书签"）≥20轮冷却
- 选定后先声明一句话预期收益，写入报告开头
+流程入口：
+- **无TODO → 进入任务规划模式**（本轮不执行任务，专注规划）：
+  1. 读 ./autonomous_reports/history.txt 了解已做方向，避免重复
+  2. 深入分析近期报告，提炼：未跟进的线索、可改进的产出、冲浪发现的待实测工具，反思之前的低价值探索
+  3. 盘点已有报告和记忆（ls autonomous_reports/ + ../memory），考虑如何发挥更大价值或优化
+  4. 综合以上，产出5-7条TODO写入 `TODO.txt`，TODO已完成内容可压缩丢后面
+  5. 每条格式：`[ ] 类型(产出/冲浪/环境) | 一句话目标 | 验收标准`

 目标排序（按价值递减）：
 1. **实用产出与能力扩展**：写工具解决痛点，在已有能力上解锁新能力（能力树每多一个节点，可能性空间变大）
 2. **环境发现**：扫描已有但未利用的工具/库/数据源/配置
-3. **小众工具挖掘**：在GitHub/V2EX/吾爱破解/果核剥壳等找冷门实用工具，实测AI常推荐但有坑的方案
+3. **小众工具挖掘**：在GitHub/V2EX/吾爱破解/果核剥壳**等**找冷门实用工具，实测AI常推荐但有坑的方案
 4. **了解用户与推荐**：分析老代码/PC文件/书签推断偏好，给出个性化推荐（游戏/视频/工具附理由）（低频）
 5. **自身演进**：思考框架不足，提出改进方案
-6. **记忆审查**：修正错误或过时记录（低频）
+6. **记忆审查**：修正错误或过时记录

-选择原则：个性化优先（只有探测这台PC才能获得的知识）→ 盲区优先（自身参数无法复现的知识）→ 假设驱动（明确要验证什么，边探测边实验）→ 禁止低价值验证（不验证静态配置、不做无假设巡检）
+**大型任务**：允许设计**有价值**的大型任务，将其分解成若干个模块或步骤，写入TODO中，每次自主行动执行处理一个模块。

-探测领域（鼓励发散，不要总盯技术/agent）：
- 有效上网冲浪：资源站巡检（果核剥壳/吾爱破解/什么值得买等→结合需求筛选）、深度阅读（≤2话题读正文提炼）。冲浪发现高价值工具/资源时，下一轮优先实测评估（冲浪→行动链）
- 实用小工具 · 本地环境健康 · 自动化优化 · 了解用户 · 推荐（游戏/视频/工具附理由） · 自身演进 · SOP/记忆维护（别每次都选） · 整理cwd
+选择原则：个性化优先（只有探测这台PC才能获得的知识）→ 盲区优先（自身参数无法复现，有一定难度）→ 假设驱动（明确要验证什么，边探测边实验）→ 禁止低价值验证（不验证静态配置、不做无假设巡检、不做你轻易完成的工作）
+
+探测策略（聚焦原则，非菜单）：
+- **线索驱动**：从近期报告中提炼的后续任务，优先于凭空选题
+- **能力树扩展**：优先能解锁新能力节点的工具/技能（一个节点带来多种可能性）
+- **个性化优先**：只有探测这台PC/这个用户才能获得的知识 > 通用知识
+- 冲浪规则：每次≤2话题，必须读正文提炼洞察，禁标题搬运；发现好工具→下轮TODO加实测任务

 禁区：❌ Hacker News · 刷新闻头条 · 泛采集标题/无目标刷新闻 · 探索知名工具基础用法 · 调研弱于当前框架的agent · 调研其他web自动化/computer use框架 · 读取自身代码库

-## 🔄 执行流程

-### 阶段 1：自主探测（用户离开时）
- **启动检查**：
-  - 读取可能有的 `./autonomous_reports/history.txt` 了解历史记录。
-  - **TODO优先**：若cwd下存在 `TODO.txt`，优先从中选择任务执行；任务完成后从TODO.txt中移除对应条目。
-  - **不连续选择相同方向**（TODO任务除外）。
- **预期收益声明**：选定任务后，必须先用一句话写明「做这个任务预期带来什么收益」。允许探索失败，但必须事先想清楚为什么值得做。这句话写入报告开头。
- **执行方式**：基于目标自由进行，无需预先批准，直接执行只读或实验性操作。
- **约束**：小步快跑，每次只做一个小任务（剩下的下次再做），控制在20个回合以内。严禁修改核心记忆/系统设置；严禁读取敏感数据（但可以检测存在性）。
+## 执行流程

-### 阶段 2：生成报告与方案
- **位置**：目录若不存在请新建
-  - 报告文件：`./autonomous_reports/RXX_简短描述.md`（XX为自增序号，从history.txt推断下一个编号）
-  - 历史索引：`./autonomous_reports/history.txt`（每条任务一行，报告写完后必须prepend）
-  - 已处理报告归档至 `./autonomous_reports/archived/`
- **history.txt格式**：请先查看此文件来获取详细格式，`#XX | 日期 | 类型 | 主题 | 结论`（严格单行，禁止换行）
- **篇幅**：默认简洁，仅关键发现详述
+### 执行（有TODO时）
+0. update_working_checkpoint: `（自主行动时长期保留）subagent任务完成后需重读自主行动sop确定验收流程`
+1. 从 `TODO.txt` 取一条作为当前任务
+2. 按 subagent_sop 召唤 subagent，input 需要包含以下全部内容：
+   - **任务**：TODO条目的目标 + 验收标准 + 一句话预期收益
+   - **权限边界**：可执行只读和实验性操作；严禁修改核心记忆/系统设置；严禁读取敏感数据（可检测存在性）；控制在30回合内
+     - 无需批准：只读探测、cwd 内写操作/脚本实验
+     - 需要报告：修改 global_mem.txt / memory/ 下 SOP、安装软件、外部 API 调用、删除非临时文件
+     - 绝对禁止：读取密钥、修改核心代码库、不可逆危险操作
+   - **报告要求**：完成后写报告到 `./autonomous_reports/R{XX}_简短描述.md`（XX从history.txt推断），格式简洁仅关键发现详述；
+     - 第一步先将此报告要求update_working_checkpoint进入工作记忆
+   - **行动准则**：边探测边实验，用临时脚本测假设；禁只读即下结论，完整验证再写报告
+3. 监控 subagent 执行，质量不佳或跑偏可提前终止放弃

-### 阶段 3：等待批准
- 用户归来后审查报告，决定批准、修改或拒绝方案。
+### 质检与验收流程
+4. subagent 完成后，读取报告进行质检：
+   - 报告是否符合格式（标题/分类/内容质量）
+   - 发现不合规可修正报告或回滚操作
+5. 更新 `./autonomous_reports/history.txt`（prepend，先读此文件了解填写格式）
+   - 在 history.txt 首行 prepend 一条：`RXX | 日期 | 类型 | 主题 | 结论`（严格单行）。
+6. 从 `TODO.txt` 移除已完成条目
+7. 若报告含记忆更新建议，评估后决定是否采纳；若发现极有价值高质量报告，可在报告文件名上标记。

-### 避免"只读陷阱"
- 发现问题要动手验证，边探测边实验，用临时脚本测假设
- 完整验证再结论：禁读部分文件即下判断，必须追踪关联文件并实测后再写报告
+### 等待用户审查
+- 用户归来后审查报告，决定批准、修改或拒绝方案
--- a/memory/subagent_sop.md
+++ b/memory/subagent_sop.md
@@ -41,7 +41,7 @@ proc = subprocess.Popen(
 **核心优势**：独立上下文。避免处理文档A的长上下文污染处理文档B的质量
 **约束**：
 - 文件系统共享是优点：不同agent处理不同输入文件，产生不同输出文件
- 共享资源冲突：键鼠/浏览器主体不可共享（浏览器可分tab但需谨慎），subagent任务应限于文件处理
+- 共享资源冲突：键鼠/浏览器主体不可共享（浏览器可分tab但需谨慎）
 - 不满足map模式的任务 → 主agent顺序执行即可，别用subagent
 **标准流程（map-reduce）**：
 1. 主agent准备阶段：爬取/dump数据，存为多个独立输入文件