refactor: 优化自主行动SOP - 强化路径提示和格式规范防止history错乱
This commit is contained in:
@@ -3,86 +3,69 @@
|
||||
⚠️ **路径警告**:autonomous_reports 在 temp/ 下,用`./autonomous_reports/`访问,**不是**`../memory/autonomous_reports/`或`../autonomous_reports/`!
|
||||
|
||||
授权你进行自主行动,只要不对环境造成副作用都可进行。
|
||||
请先选择核心目标,再选择一个小目标进行。最终探测结果形成报告(含操作申请),待用户回来确认后再进行可能的写入或修改操作。
|
||||
|
||||
---
|
||||
## 🚫 Step 0(阻塞):写入约束便签 — 未完成禁止进入后续步骤
|
||||
|
||||
**必须第一个动作就调用** `update_working_checkpoint`,写入以下内容:
|
||||
|
||||
```
|
||||
自主探索|≤15回合|只有cwd内可写|用户不在(问题存报告)|报告目录:./autonomous_reports/|收尾:重读本SOP确认报告目录+更新history|产出=报告+记忆提案 | 路径警告:autonomous_reports在temp/下,用./autonomous_reports/访问,严禁../memory/autonomous_reports/或../autonomous_reports/!
|
||||
```
|
||||
|
||||
⛔ **跳过 Step 0 = 违规**。历史教训:R175因跳过此步,报告存错路径(Desktop而非./autonomous_reports/)。
|
||||
|
||||
---
|
||||
|
||||
## 📋 大纲
|
||||
- 报告目录与规则
|
||||
- 任务选择
|
||||
- 执行流程与注意事项
|
||||
|
||||
## 报告目录与规则
|
||||
|
||||
⚠️ 历史记录唯一位置:`./autonomous_reports/history.txt`
|
||||
如有TODO,进入**执行模式**,使用subagent并监控其执行;
|
||||
如果没有TODO,进入**任务规划模式**,深入分析并形成多个有价值的自主探索任务。不执行,待下次自主行动执行。
|
||||
|
||||
报告存于 `./autonomous_reports/`,文件名 `RXX_简短描述.md`(XX从 history.txt 推断自增)。
|
||||
完成后在 history.txt 首行 prepend 一条:`RXX | 日期 | 类型 | 主题 | 结论`(严格单行)。已处理报告归档至 `archived/`。
|
||||
|
||||
权限边界:
|
||||
- 无需批准:只读探测、cwd 内写操作/脚本实验
|
||||
- 需要报告:修改 global_mem.txt / memory/ 下 SOP、安装软件、外部 API 调用、删除非临时文件
|
||||
- 绝对禁止:读取密钥、修改核心代码库、不可逆危险操作
|
||||
|
||||
## 任务选择
|
||||
- **有TODO**:cwd下 `TODO.txt` 有待执行条目 → 直接跳到「执行流程」
|
||||
|
||||
价值公式:**「AI训练数据无法覆盖」×「对未来协作有持久收益」**。核心产出是记忆——有价值的发现整理为记忆更新提案纳入报告。
|
||||
|
||||
选择规则:
|
||||
- cwd下有 `TODO.txt` 时优先执行其中任务,完成后移除条目
|
||||
- 不连续选择相同方向(TODO除外),选择前先读 history.txt 了解近期已做方向
|
||||
- 方向平衡:近10轮内同一方向≤3次,同一具体主题(如"磁盘健康""书签")≥20轮冷却
|
||||
- 选定后先声明一句话预期收益,写入报告开头
|
||||
流程入口:
|
||||
- **无TODO → 进入任务规划模式**(本轮不执行任务,专注规划):
|
||||
1. 读 ./autonomous_reports/history.txt 了解已做方向,避免重复
|
||||
2. 深入分析近期报告,提炼:未跟进的线索、可改进的产出、冲浪发现的待实测工具,反思之前的低价值探索
|
||||
3. 盘点已有报告和记忆(ls autonomous_reports/ + ../memory),考虑如何发挥更大价值或优化
|
||||
4. 综合以上,产出5-7条TODO写入 `TODO.txt`,TODO已完成内容可压缩丢后面
|
||||
5. 每条格式:`[ ] 类型(产出/冲浪/环境) | 一句话目标 | 验收标准`
|
||||
|
||||
目标排序(按价值递减):
|
||||
1. **实用产出与能力扩展**:写工具解决痛点,在已有能力上解锁新能力(能力树每多一个节点,可能性空间变大)
|
||||
2. **环境发现**:扫描已有但未利用的工具/库/数据源/配置
|
||||
3. **小众工具挖掘**:在GitHub/V2EX/吾爱破解/果核剥壳等找冷门实用工具,实测AI常推荐但有坑的方案
|
||||
3. **小众工具挖掘**:在GitHub/V2EX/吾爱破解/果核剥壳**等**找冷门实用工具,实测AI常推荐但有坑的方案
|
||||
4. **了解用户与推荐**:分析老代码/PC文件/书签推断偏好,给出个性化推荐(游戏/视频/工具附理由)(低频)
|
||||
5. **自身演进**:思考框架不足,提出改进方案
|
||||
6. **记忆审查**:修正错误或过时记录(低频)
|
||||
6. **记忆审查**:修正错误或过时记录
|
||||
|
||||
选择原则:个性化优先(只有探测这台PC才能获得的知识)→ 盲区优先(自身参数无法复现的知识)→ 假设驱动(明确要验证什么,边探测边实验)→ 禁止低价值验证(不验证静态配置、不做无假设巡检)
|
||||
**大型任务**:允许设计**有价值**的大型任务,将其分解成若干个模块或步骤,写入TODO中,每次自主行动执行处理一个模块。
|
||||
|
||||
探测领域(鼓励发散,不要总盯技术/agent):
|
||||
- 有效上网冲浪:资源站巡检(果核剥壳/吾爱破解/什么值得买等→结合需求筛选)、深度阅读(≤2话题读正文提炼)。冲浪发现高价值工具/资源时,下一轮优先实测评估(冲浪→行动链)
|
||||
- 实用小工具 · 本地环境健康 · 自动化优化 · 了解用户 · 推荐(游戏/视频/工具附理由) · 自身演进 · SOP/记忆维护(别每次都选) · 整理cwd
|
||||
选择原则:个性化优先(只有探测这台PC才能获得的知识)→ 盲区优先(自身参数无法复现,有一定难度)→ 假设驱动(明确要验证什么,边探测边实验)→ 禁止低价值验证(不验证静态配置、不做无假设巡检、不做你轻易完成的工作)
|
||||
|
||||
探测策略(聚焦原则,非菜单):
|
||||
- **线索驱动**:从近期报告中提炼的后续任务,优先于凭空选题
|
||||
- **能力树扩展**:优先能解锁新能力节点的工具/技能(一个节点带来多种可能性)
|
||||
- **个性化优先**:只有探测这台PC/这个用户才能获得的知识 > 通用知识
|
||||
- 冲浪规则:每次≤2话题,必须读正文提炼洞察,禁标题搬运;发现好工具→下轮TODO加实测任务
|
||||
|
||||
禁区:❌ Hacker News · 刷新闻头条 · 泛采集标题/无目标刷新闻 · 探索知名工具基础用法 · 调研弱于当前框架的agent · 调研其他web自动化/computer use框架 · 读取自身代码库
|
||||
|
||||
## 🔄 执行流程
|
||||
|
||||
### 阶段 1:自主探测(用户离开时)
|
||||
- **启动检查**:
|
||||
- 读取可能有的 `./autonomous_reports/history.txt` 了解历史记录。
|
||||
- **TODO优先**:若cwd下存在 `TODO.txt`,优先从中选择任务执行;任务完成后从TODO.txt中移除对应条目。
|
||||
- **不连续选择相同方向**(TODO任务除外)。
|
||||
- **预期收益声明**:选定任务后,必须先用一句话写明「做这个任务预期带来什么收益」。允许探索失败,但必须事先想清楚为什么值得做。这句话写入报告开头。
|
||||
- **执行方式**:基于目标自由进行,无需预先批准,直接执行只读或实验性操作。
|
||||
- **约束**:小步快跑,每次只做一个小任务(剩下的下次再做),控制在20个回合以内。严禁修改核心记忆/系统设置;严禁读取敏感数据(但可以检测存在性)。
|
||||
## 执行流程
|
||||
|
||||
### 阶段 2:生成报告与方案
|
||||
- **位置**:目录若不存在请新建
|
||||
- 报告文件:`./autonomous_reports/RXX_简短描述.md`(XX为自增序号,从history.txt推断下一个编号)
|
||||
- 历史索引:`./autonomous_reports/history.txt`(每条任务一行,报告写完后必须prepend)
|
||||
- 已处理报告归档至 `./autonomous_reports/archived/`
|
||||
- **history.txt格式**:请先查看此文件来获取详细格式,`#XX | 日期 | 类型 | 主题 | 结论`(严格单行,禁止换行)
|
||||
- **篇幅**:默认简洁,仅关键发现详述
|
||||
### 执行(有TODO时)
|
||||
0. update_working_checkpoint: `(自主行动时长期保留)subagent任务完成后需重读自主行动sop确定验收流程`
|
||||
1. 从 `TODO.txt` 取一条作为当前任务
|
||||
2. 按 subagent_sop 召唤 subagent,input 需要包含以下全部内容:
|
||||
- **任务**:TODO条目的目标 + 验收标准 + 一句话预期收益
|
||||
- **权限边界**:可执行只读和实验性操作;严禁修改核心记忆/系统设置;严禁读取敏感数据(可检测存在性);控制在30回合内
|
||||
- 无需批准:只读探测、cwd 内写操作/脚本实验
|
||||
- 需要报告:修改 global_mem.txt / memory/ 下 SOP、安装软件、外部 API 调用、删除非临时文件
|
||||
- 绝对禁止:读取密钥、修改核心代码库、不可逆危险操作
|
||||
- **报告要求**:完成后写报告到 `./autonomous_reports/R{XX}_简短描述.md`(XX从history.txt推断),格式简洁仅关键发现详述;
|
||||
- 第一步先将此报告要求update_working_checkpoint进入工作记忆
|
||||
- **行动准则**:边探测边实验,用临时脚本测假设;禁只读即下结论,完整验证再写报告
|
||||
3. 监控 subagent 执行,质量不佳或跑偏可提前终止放弃
|
||||
|
||||
### 阶段 3:等待批准
|
||||
- 用户归来后审查报告,决定批准、修改或拒绝方案。
|
||||
### 质检与验收流程
|
||||
4. subagent 完成后,读取报告进行质检:
|
||||
- 报告是否符合格式(标题/分类/内容质量)
|
||||
- 发现不合规可修正报告或回滚操作
|
||||
5. 更新 `./autonomous_reports/history.txt`(prepend,先读此文件了解填写格式)
|
||||
- 在 history.txt 首行 prepend 一条:`RXX | 日期 | 类型 | 主题 | 结论`(严格单行)。
|
||||
6. 从 `TODO.txt` 移除已完成条目
|
||||
7. 若报告含记忆更新建议,评估后决定是否采纳;若发现极有价值高质量报告,可在报告文件名上标记。
|
||||
|
||||
### 避免"只读陷阱"
|
||||
- 发现问题要动手验证,边探测边实验,用临时脚本测假设
|
||||
- 完整验证再结论:禁读部分文件即下判断,必须追踪关联文件并实测后再写报告
|
||||
### 等待用户审查
|
||||
- 用户归来后审查报告,决定批准、修改或拒绝方案
|
||||
|
||||
@@ -41,7 +41,7 @@ proc = subprocess.Popen(
|
||||
**核心优势**:独立上下文。避免处理文档A的长上下文污染处理文档B的质量
|
||||
**约束**:
|
||||
- 文件系统共享是优点:不同agent处理不同输入文件,产生不同输出文件
|
||||
- 共享资源冲突:键鼠/浏览器主体不可共享(浏览器可分tab但需谨慎),subagent任务应限于文件处理
|
||||
- 共享资源冲突:键鼠/浏览器主体不可共享(浏览器可分tab但需谨慎)
|
||||
- 不满足map模式的任务 → 主agent顺序执行即可,别用subagent
|
||||
**标准流程(map-reduce)**:
|
||||
1. 主agent准备阶段:爬取/dump数据,存为多个独立输入文件
|
||||
|
||||
Reference in New Issue
Block a user