Files
GenericAgent/memory/autonomous_operation_sop/task_planning.md

3.3 KiB
Raw Blame History

任务规划模式

  • 有TODOcwd下 TODO.txt 有待执行条目 → 直接跳到「执行流程」

价值公式:「AI训练数据无法覆盖」×「对未来协作有持久收益」。核心产出是记忆——有价值的发现整理为记忆更新提案纳入报告。

流程入口:

  • 无TODO → 进入任务规划模式(本轮不执行任务,专注规划): 0. update_working_checkpoint: 规划模式产出TODO后立即结束本轮禁止执行任何TODO等待下次自主行动进入执行模式
    1. ⚠️ 批判性读history.txt90%历史任务是低价值的,读取目的是识别失败模式并避免,而非寻找模仿对象
      • 识别低价值模式:浅层验证、无假设巡检、重复探索、泛采集、知名工具基础用法
      • 提炼高价值线索:未跟进的发现、待实测工具、可改进产出
    2. 反思:为什么这些任务低价值?如何设计才能高价值?
    3. 批判性盘点已有报告和记忆ls autonomous_reports/ + ../memory考虑如何发挥更大价值或优化
    4. 综合以上产出5-7条TODO写入 TODO.txtTODO已完成内容可压缩丢后面
    5. 每条格式:[ ] 类型(产出/冲浪/环境) | 一句话目标 | 验收标准
    6. 召唤subagent评审TODOinput仅给TODO列表+"读记忆库自行判断逐条评分1-10并简述理由"(不喂额外先验信息)
    7. 读subagent评分低分项删除或替换
    8. 立刻结束,下次行动再执行

目标排序(按价值递减):

  1. 实用产出与能力扩展:写工具解决痛点,在已有能力上解锁新能力(能力树每多一个节点,可能性空间变大)
  2. 环境发现:扫描已有但未利用的工具/库/数据源/配置
  3. 小众工具挖掘在GitHub/V2EX/吾爱破解/果核剥壳找冷门实用工具实测AI常推荐但有坑的方案
  4. 了解用户与推荐:分析老代码/PC文件/书签推断偏好,给出个性化推荐(游戏/视频/工具附理由)(低频)
  5. 自身演进:思考框架不足,提出改进方案
  6. 记忆审查:修正错误或过时记录

大型任务:允许设计有价值的大型任务将其分解成若干个模块或步骤写入TODO中每次自主行动执行处理一个模块。

选择原则个性化优先只有探测这台PC才能获得的知识→ 盲区优先(自身参数无法复现,有一定难度)→ 假设驱动(明确要验证什么,边探测边实验)→ 禁止低价值验证(不验证静态配置、不做无假设巡检、不做你轻易完成的工作)

探测策略(聚焦原则,非菜单):

  • 线索驱动:从近期报告中提炼的后续任务,优先于凭空选题
  • 能力树扩展:优先能解锁新能力节点的工具/技能(一个节点带来多种可能性)
  • 个性化优先只有探测这台PC/这个用户才能获得的知识 > 通用知识
  • 冲浪规则每次≤2话题必须读正文提炼洞察禁标题搬运发现好工具→下轮TODO加实测任务

禁区: Hacker News · 刷新闻头条 · 泛采集标题/无目标刷新闻 · 探索知名工具基础用法 · 调研弱于当前框架的agent · 调研其他web自动化/computer use框架 · 读取自身代码库