Files
GenericAgent/memory/autonomous_operation_sop.md

88 lines
6.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 自主行动 SOP (探测-报告-执行)
⚠️ **路径警告**autonomous_reports 在 temp/ 下,用`./autonomous_reports/`访问,**不是**`../memory/autonomous_reports/``../autonomous_reports/`
授权你进行自主行动,只要不对环境造成副作用都可进行。
首先根据有无TODO确定**执行模式**或**任务规划模式**
如有TODO进入**执行模式**取一条TODO执行完成后本轮结束不继续执行下一条
如果没有TODO进入**任务规划模式**,深入分析并形成多个有价值的自主探索任务。规划完成后本轮结束,待下次自主行动执行。
报告存于 `./autonomous_reports/`,文件名 `RXX_简短描述.md`XX从 history.txt 推断自增)。
## 任务规划模式
- **有TODO**cwd下 `TODO.txt` 有待执行条目 → 直接跳到「执行流程」
价值公式:**「AI训练数据无法覆盖」×「对未来协作有持久收益」**。核心产出是记忆——有价值的发现整理为记忆更新提案纳入报告。
流程入口:
- **无TODO → 进入任务规划模式**(本轮不执行任务,专注规划):
0. update_working_checkpoint: `规划模式产出TODO后立即结束本轮禁止执行任何TODO等待下次自主行动进入执行模式`
1. ⚠️ **批判性读history.txt**90%历史任务是低价值的,读取目的是**识别失败模式并避免**,而非寻找模仿对象
- 识别低价值模式:浅层验证、无假设巡检、重复探索、泛采集、知名工具基础用法
- 提炼高价值线索:未跟进的发现、待实测工具、可改进产出
2. 反思:为什么这些任务低价值?如何设计才能高价值?
3. 批判性盘点已有报告和记忆ls autonomous_reports/ + ../memory考虑如何发挥更大价值或优化
4. 综合以上产出5-7条TODO写入 `TODO.txt`TODO已完成内容可压缩丢后面
5. 每条格式:`[ ] 类型(产出/冲浪/环境) | 一句话目标 | 验收标准`
6. 召唤subagent评审TODOinput仅给TODO列表+"读记忆库自行判断逐条评分1-10并简述理由"(不喂额外先验信息)
7. 读subagent评分低分项删除或替换
8. 立刻**结束**,下次行动再执行
目标排序(按价值递减):
1. **实用产出与能力扩展**:写工具解决痛点,在已有能力上解锁新能力(能力树每多一个节点,可能性空间变大)
2. **环境发现**:扫描已有但未利用的工具/库/数据源/配置
3. **小众工具挖掘**在GitHub/V2EX/吾爱破解/果核剥壳**等**找冷门实用工具实测AI常推荐但有坑的方案
4. **了解用户与推荐**:分析老代码/PC文件/书签推断偏好,给出个性化推荐(游戏/视频/工具附理由)(低频)
5. **自身演进**:思考框架不足,提出改进方案
6. **记忆审查**:修正错误或过时记录
**大型任务**:允许设计**有价值**的大型任务将其分解成若干个模块或步骤写入TODO中每次自主行动执行处理一个模块。
选择原则个性化优先只有探测这台PC才能获得的知识→ 盲区优先(自身参数无法复现,有一定难度)→ 假设驱动(明确要验证什么,边探测边实验)→ 禁止低价值验证(不验证静态配置、不做无假设巡检、不做你轻易完成的工作)
探测策略(聚焦原则,非菜单):
- **线索驱动**:从近期报告中提炼的后续任务,优先于凭空选题
- **能力树扩展**:优先能解锁新能力节点的工具/技能(一个节点带来多种可能性)
- **个性化优先**只有探测这台PC/这个用户才能获得的知识 > 通用知识
- 冲浪规则每次≤2话题必须读正文提炼洞察禁标题搬运发现好工具→下轮TODO加实测任务
禁区:❌ Hacker News · 刷新闻头条 · 泛采集标题/无目标刷新闻 · 探索知名工具基础用法 · 调研弱于当前框架的agent · 调研其他web自动化/computer use框架 · 读取自身代码库
## 执行模式
⚠️ **监工原则(硬约束)**主agent在执行模式中**只当监工**,严禁亲自执行任务的实际工作。
- ❌ 禁止主agent自己写脚本跑数据、调API、扫描目录、处理文件等一切「干活」行为
- ❌ 禁止主agent以「为subagent准备数据」为由自己先执行部分工作
- ✅ 允许选任务、写input.txt任务描述、启动subagent、轮询监控、质检验收、更新history
- 原则:所有实际探测/数据收集/脚本编写/API调用都写进input.txt让subagent去做
### 执行有TODO时
0.`TODO.txt` 取**一条**作为当前任务
1. update_working_checkpoint: `{选定的当前任务}\n自主行动时长期保留subagent任务完成后需重读自主行动sop确定验收流程。每次只执行一个任务`
2. 按 subagent_sop 召唤 subagentinput 需要包含以下全部内容:
- **任务**:详细介绍和要求深入执行当前任务 + 验收标准 + 一句话预期收益
- **所有实际工作都由subagent完成**包括数据收集、目录扫描、API调用、脚本编写等主agent不做任何准备工作
- **权限边界**:可执行只读和实验性操作;严禁修改核心记忆/系统设置严禁读取敏感数据可检测存在性控制在30回合内
- 无需批准只读探测、cwd 内写操作/脚本实验
- 需要报告:修改 global_mem.txt / memory/ 下 SOP、安装软件、外部 API 调用、删除非临时文件
- 绝对禁止:读取密钥、修改核心代码库、不可逆危险操作
- **报告要求**:完成后写报告到 `./autonomous_reports/R{XX}_简短描述.md`XX从history.txt推断格式简洁仅关键发现详述
- 第一步先将此报告要求update_working_checkpoint进入工作记忆
- **行动准则**:边探测边实验,用临时脚本测假设;禁只读即下结论,完整验证再写报告
3. 监控 subagent 执行,质量不佳或跑偏可提前终止放弃(监控≠亲自干活)
### 质检与验收流程
4. subagent 完成后,读取报告进行质检:
- 报告是否符合格式(标题/分类/内容质量)
- 发现不合规可修正报告或回滚操作
- 可通过 reply 机制追问 subagent
5. 更新 `./autonomous_reports/history.txt`prepend先读此文件了解填写格式
- 在 history.txt 首行 prepend 一条:`RXX | 日期 | 类型 | 主题 | 结论`(严格单行)。
6.`TODO.txt` 移除已完成条目
7. 若报告含记忆更新建议,评估后决定是否采纳;若发现极有价值高质量报告,可在报告文件名上标记。
8. 停止,等待下次自主行动
### 等待用户审查
- 用户归来后审查报告,决定批准、修改或拒绝方案