5.9 KiB
5.9 KiB
自主行动 SOP (探测-报告-执行)
⚠️ 路径警告:autonomous_reports 在 temp/ 下,用./autonomous_reports/访问,不是../memory/autonomous_reports/或../autonomous_reports/!
授权你进行自主行动,只要不对环境造成副作用都可进行。 首先根据有无TODO确定执行模式或任务规划模式 如有TODO,进入执行模式,取一条TODO执行,完成后本轮结束(不继续执行下一条); 如果没有TODO,进入任务规划模式,深入分析并形成多个有价值的自主探索任务。规划完成后本轮结束,待下次自主行动执行。
报告存于 ./autonomous_reports/,文件名 RXX_简短描述.md(XX从 history.txt 推断自增)。
任务规划模式
- 有TODO:cwd下
TODO.txt有待执行条目 → 直接跳到「执行流程」
价值公式:「AI训练数据无法覆盖」×「对未来协作有持久收益」。核心产出是记忆——有价值的发现整理为记忆更新提案纳入报告。
流程入口:
- 无TODO → 进入任务规划模式(本轮不执行任务,专注规划):
0. update_working_checkpoint:
规划模式:产出TODO后立即结束本轮,禁止执行任何TODO,等待下次自主行动进入执行模式- ⚠️ 批判性读history.txt:90%历史任务是低价值的,读取目的是识别失败模式并避免,而非寻找模仿对象
- 识别低价值模式:浅层验证、无假设巡检、重复探索、泛采集、知名工具基础用法
- 提炼高价值线索:未跟进的发现、待实测工具、可改进产出
- 反思:为什么这些任务低价值?如何设计才能高价值?
- 批判性盘点已有报告和记忆(ls autonomous_reports/ + ../memory),考虑如何发挥更大价值或优化
- 综合以上,产出5-7条TODO写入
TODO.txt,TODO已完成内容可压缩丢后面 - 每条格式:
[ ] 类型(产出/冲浪/环境) | 一句话目标 | 验收标准 - 召唤subagent评审TODO:input仅给TODO列表+"读记忆库自行判断,逐条评分1-10并简述理由"(不喂额外先验信息)
- 读subagent评分,低分项删除或替换
- 立刻结束,下次行动再执行
- ⚠️ 批判性读history.txt:90%历史任务是低价值的,读取目的是识别失败模式并避免,而非寻找模仿对象
目标排序(按价值递减):
- 实用产出与能力扩展:写工具解决痛点,在已有能力上解锁新能力(能力树每多一个节点,可能性空间变大)
- 环境发现:扫描已有但未利用的工具/库/数据源/配置
- 小众工具挖掘:在GitHub/V2EX/吾爱破解/果核剥壳等找冷门实用工具,实测AI常推荐但有坑的方案
- 了解用户与推荐:分析老代码/PC文件/书签推断偏好,给出个性化推荐(游戏/视频/工具附理由)(低频)
- 自身演进:思考框架不足,提出改进方案
- 记忆审查:修正错误或过时记录
大型任务:允许设计有价值的大型任务,将其分解成若干个模块或步骤,写入TODO中,每次自主行动执行处理一个模块。
选择原则:个性化优先(只有探测这台PC才能获得的知识)→ 盲区优先(自身参数无法复现,有一定难度)→ 假设驱动(明确要验证什么,边探测边实验)→ 禁止低价值验证(不验证静态配置、不做无假设巡检、不做你轻易完成的工作)
探测策略(聚焦原则,非菜单):
- 线索驱动:从近期报告中提炼的后续任务,优先于凭空选题
- 能力树扩展:优先能解锁新能力节点的工具/技能(一个节点带来多种可能性)
- 个性化优先:只有探测这台PC/这个用户才能获得的知识 > 通用知识
- 冲浪规则:每次≤2话题,必须读正文提炼洞察,禁标题搬运;发现好工具→下轮TODO加实测任务
禁区:❌ Hacker News · 刷新闻头条 · 泛采集标题/无目标刷新闻 · 探索知名工具基础用法 · 调研弱于当前框架的agent · 调研其他web自动化/computer use框架 · 读取自身代码库
执行模式
执行(有TODO时)
- 从
TODO.txt取一条作为当前任务 - update_working_checkpoint:
{选定的当前任务}\n(自主行动时长期保留)subagent任务完成后需重读自主行动sop确定验收流程 - 按 subagent_sop 召唤 subagent,input 需要包含以下全部内容:
- 任务:详细介绍和要求深入执行当前任务 + 验收标准 + 一句话预期收益
- 权限边界:可执行只读和实验性操作;严禁修改核心记忆/系统设置;严禁读取敏感数据(可检测存在性);控制在30回合内
- 无需批准:只读探测、cwd 内写操作/脚本实验
- 需要报告:修改 global_mem.txt / memory/ 下 SOP、安装软件、外部 API 调用、删除非临时文件
- 绝对禁止:读取密钥、修改核心代码库、不可逆危险操作
- 报告要求:完成后写报告到
./autonomous_reports/R{XX}_简短描述.md(XX从history.txt推断),格式简洁仅关键发现详述;- 第一步先将此报告要求update_working_checkpoint进入工作记忆
- 行动准则:边探测边实验,用临时脚本测假设;禁只读即下结论,完整验证再写报告
- 监控 subagent 执行,质量不佳或跑偏可提前终止放弃
质检与验收流程
- subagent 完成后,读取报告进行质检:
- 报告是否符合格式(标题/分类/内容质量)
- 发现不合规可修正报告或回滚操作
- 更新
./autonomous_reports/history.txt(prepend,先读此文件了解填写格式)- 在 history.txt 首行 prepend 一条:
RXX | 日期 | 类型 | 主题 | 结论(严格单行)。
- 在 history.txt 首行 prepend 一条:
- 从
TODO.txt移除已完成条目 - 若报告含记忆更新建议,评估后决定是否采纳;若发现极有价值高质量报告,可在报告文件名上标记。
等待用户审查
- 用户归来后审查报告,决定批准、修改或拒绝方案