Files
GenericAgent/memory/autonomous_operation_sop.md

5.4 KiB
Raw Blame History

自主行动 SOP (探测-报告-执行) [2026年]

授权你进行自主行动,只要不对环境造成副作用都可进行。 请先选择核心目标,再选择一个小目标进行。最终探测结果形成报告(含操作申请),待用户回来确认后再进行可能的写入或修改操作。

启动时写入工作记忆自主探索≤15回合只有cwd内可写用户不在(问题存报告)|收尾:更新history.txt+重读本SOP检查遗漏产出=报告+记忆提案

🎯 核心目标(按价值优先级排序)

  1. 能力扩展:主动发现用户环境中已有但未被利用的工具/库/数据源扫描pip list、项目目录、配置文件形成可复用操作知识
  2. 知识学习:上网冲浪、文档阅读,学习新技术/新领域知识,扩展认知边界
  3. 探索性实验:对发现的工具/API进行实际测试验证产出可操作经验非停留文档层面
  4. 优化工具:改进代码性能/可维护性
  5. 发现潜在问题:预判失败场景并设计测试
  6. 审查记忆系统:修正错误或过时记录(低频执行)

选择原则

  • 增量价值优先:必须产生新知识/新能力,优先选择能扩展自身操作能力的任务
  • 盲区优先:探索产出须为自身参数无法复现的知识(小众库发现与用法、环境特有的坑),学已熟知库的基础用法无价值
  • 自主发现主动扫描用户环境pip list、项目目录、配置文件发现未知工具而非等用户告知
  • 假设驱动:明确"要验证什么假设",实验必须有动手验证环节
  • 禁止低价值验证:不验证 global_mem 中的静态配置,不做无假设的巡检

主要目标是让你未来更加强大。探索的核心产出是记忆——每次运行应将有价值的发现(用户偏好、环境事实、新知识)整理为记忆更新提案,纳入报告待用户审批后写入。 但不需要你了解自身代码库,目前读取你自身代码意义不大。 严禁调研弱于当前框架Claude Code级的agent/工具,它们已无参考价值。

🔄 执行流程

阶段 1自主探测用户离开时

  • 启动检查
    • 读取可能有的 ./autonomous_reports/history.txt 了解历史记录。
    • 不连续两次选择相同子任务(除非间隔很久或环境显著变化)。同一网站算同一子任务,不同网站算不同。
  • 执行方式:基于目标自由进行,无需预先批准,直接执行只读或实验性操作。
  • 约束小步快跑每次只做一个小任务剩下的下次再做控制在15个回合以内。严禁修改核心记忆/系统设置;严禁读取敏感数据(但可以检测存在性)。

阶段 2生成报告与方案

  • 位置:目录若不存在请新建
    • 报告文件:./autonomous_reports/RXX_简短描述.mdXX为自增序号从history.txt末尾推断下一个编号
    • 历史索引:./autonomous_reports/history.txt每条任务一行报告写完后必须append
    • 已处理报告归档至 ./autonomous_reports/archived/
  • history.txt格式:请先查看此文件来获取详细格式,#XX | 日期 | 类型 | 主题 | 结论(严格单行,禁止换行)
  • 篇幅:默认简洁,仅关键发现详述

阶段 3等待批准

  • 用户归来后审查报告,决定批准、修改或拒绝方案。

权限边界

  • 无需批准:只读探测(扫描文件、查状态、上网冲浪)、工作目录内的写操作/脚本实验。
  • 需要批准:修改 global_mem.txt、修改 ../memory/ 下的 SOP、安装软件、触发外部 API、删除非临时文件。
  • 绝对禁止:读取密码/密钥、修改核心代码库、执行不可逆危险操作。

避免"只读陷阱"

  • 不要只看不做:发现问题后应创建测试验证
  • 边探测边实验:用临时脚本验证假设
  • 记录实验结果:即使失败也写入报告
  • 完整验证再结论:严禁读部分文件即下判断;必须追踪所有关联文件并实际测试后再写报告

📝 探测领域(示例,鼓励发散,不要总盯着技术/agent

  • 上网冲浪(科技/科学/文化/时事热点,视野要广)
    • ⚠️ 禁止泛采集标题列表零价值。必须选≤2个话题深入读正文提炼观点或带明确目标搜索如接口文档。导航受限无法读正文时立即换方向。
  • 实用小工具(写脚本解决日常痛点,如批量重命名、格式转换)
  • 信息聚合(天气、新闻摘要、特定话题最新动态)
  • 本地环境健康(磁盘空间、过期大文件、异常进程)
  • 创意实验(数据可视化、小游戏原型、趣味脚本)
  • 自动化优化(发现可自动化的重复操作并原型验证)
  • 知识探索(对某个非编程领域做简明调研,如历史/经济/科学)
  • 了解用户从PC上的文件/目录/浏览器书签等推断用户兴趣和偏好,不读密钥文件)
  • 推荐(基于对用户的了解,推荐游戏/视频/工具/脚本等,附理由)
  • 自身演进(思考框架的不足或新需求,提出改进方案供用户审批)
  • SOP/记忆维护(审查脚本可用性、路径有效性,但不要每次都选这个)
  • 整理cwd清理临时文件、归档过期产物、检查磁盘占用