From 03069dbd89109ab252094653d39bbde0ca14ce64 Mon Sep 17 00:00:00 2001 From: Jiaqing Liang Date: Thu, 12 Mar 2026 09:29:20 +0800 Subject: [PATCH] =?UTF-8?q?=E4=BF=AE=E5=A4=8D=E8=87=AA=E4=B8=BB=E8=A1=8C?= =?UTF-8?q?=E5=8A=A8SOP=EF=BC=9A=E8=A7=84=E5=88=92=E5=AE=8C=E7=AB=8B?= =?UTF-8?q?=E5=8D=B3=E5=81=9C=E6=AD=A2+=E9=81=BF=E5=85=8D=E6=A8=A1?= =?UTF-8?q?=E4=BB=BF=E4=BD=8E=E4=BB=B7=E5=80=BC=E4=BB=BB=E5=8A=A1?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- memory/autonomous_operation_sop.md | 25 +++++++++++++++---------- 1 file changed, 15 insertions(+), 10 deletions(-) diff --git a/memory/autonomous_operation_sop.md b/memory/autonomous_operation_sop.md index ed92efd..50089b6 100644 --- a/memory/autonomous_operation_sop.md +++ b/memory/autonomous_operation_sop.md @@ -3,23 +3,28 @@ ⚠️ **路径警告**:autonomous_reports 在 temp/ 下,用`./autonomous_reports/`访问,**不是**`../memory/autonomous_reports/`或`../autonomous_reports/`! 授权你进行自主行动,只要不对环境造成副作用都可进行。 -如有TODO,进入**执行模式**,使用subagent并监控其执行; -如果没有TODO,进入**任务规划模式**,深入分析并形成多个有价值的自主探索任务。不执行,待下次自主行动执行。 +首先根据有无TODO确定**执行模式**或**任务规划模式** +如有TODO,进入**执行模式**,取一条TODO执行,完成后本轮结束(不继续执行下一条); +如果没有TODO,进入**任务规划模式**,深入分析并形成多个有价值的自主探索任务。规划完成后本轮结束,待下次自主行动执行。 报告存于 `./autonomous_reports/`,文件名 `RXX_简短描述.md`(XX从 history.txt 推断自增)。 -## 任务选择 +## 任务规划模式 - **有TODO**:cwd下 `TODO.txt` 有待执行条目 → 直接跳到「执行流程」 价值公式:**「AI训练数据无法覆盖」×「对未来协作有持久收益」**。核心产出是记忆——有价值的发现整理为记忆更新提案纳入报告。 流程入口: - **无TODO → 进入任务规划模式**(本轮不执行任务,专注规划): - 1. 读 ./autonomous_reports/history.txt 了解已做方向,避免重复 - 2. 深入分析近期报告,提炼:未跟进的线索、可改进的产出、冲浪发现的待实测工具,反思之前的低价值探索 - 3. 盘点已有报告和记忆(ls autonomous_reports/ + ../memory),考虑如何发挥更大价值或优化 + 0. update_working_checkpoint: `规划模式:产出TODO后立即结束本轮,禁止执行任何TODO,等待下次自主行动进入执行模式` + 1. ⚠️ **批判性读history.txt**:90%历史任务是低价值的,读取目的是**识别失败模式并避免**,而非寻找模仿对象 + - 识别低价值模式:浅层验证、无假设巡检、重复探索、泛采集、知名工具基础用法 + - 提炼高价值线索:未跟进的发现、待实测工具、可改进产出 + 2. 反思:为什么这些任务低价值?如何设计才能高价值? + 3. 批判性盘点已有报告和记忆(ls autonomous_reports/ + ../memory),考虑如何发挥更大价值或优化 4. 综合以上,产出5-7条TODO写入 `TODO.txt`,TODO已完成内容可压缩丢后面 5. 每条格式:`[ ] 类型(产出/冲浪/环境) | 一句话目标 | 验收标准` + 6. 立刻**结束**,下次行动再执行 目标排序(按价值递减): 1. **实用产出与能力扩展**:写工具解决痛点,在已有能力上解锁新能力(能力树每多一个节点,可能性空间变大) @@ -42,13 +47,13 @@ 禁区:❌ Hacker News · 刷新闻头条 · 泛采集标题/无目标刷新闻 · 探索知名工具基础用法 · 调研弱于当前框架的agent · 调研其他web自动化/computer use框架 · 读取自身代码库 -## 执行流程 +## 执行模式 ### 执行(有TODO时) -0. update_working_checkpoint: `(自主行动时长期保留)subagent任务完成后需重读自主行动sop确定验收流程` -1. 从 `TODO.txt` 取一条作为当前任务 +0. 从 `TODO.txt` 取一条作为当前任务 +1. update_working_checkpoint: `{选定的当前任务}\n(自主行动时长期保留)subagent任务完成后需重读自主行动sop确定验收流程` 2. 按 subagent_sop 召唤 subagent,input 需要包含以下全部内容: - - **任务**:TODO条目的目标 + 验收标准 + 一句话预期收益 + - **任务**:详细介绍和要求当前任务 + 验收标准 + 一句话预期收益 - **权限边界**:可执行只读和实验性操作;严禁修改核心记忆/系统设置;严禁读取敏感数据(可检测存在性);控制在30回合内 - 无需批准:只读探测、cwd 内写操作/脚本实验 - 需要报告:修改 global_mem.txt / memory/ 下 SOP、安装软件、外部 API 调用、删除非临时文件