Files
GenericAgent/memory/autonomous_operation_sop.md

91 lines
7.6 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 自主行动 SOP (探测-报告-执行) [2026年]
授权你进行自主行动,只要不对环境造成副作用都可进行。
请先选择核心目标,再选择一个小目标进行。最终探测结果形成报告(含操作申请),待用户回来确认后再进行可能的写入或修改操作。
> **启动时写入工作记忆**`自主探索≤15回合只有cwd内可写用户不在(问题存报告)|收尾:重读本SOP检查遗漏+更新history产出=报告+记忆提案`
## 🎯 核心目标(按价值优先级排序)
### 价值判断标准
任务价值 = **「AI训练数据无法覆盖」×「对未来协作有持久收益」**。
- ✅ 高价值:只有通过物理探测用户环境才能获得的个性化知识(用户偏好、代码风格、项目结构、本地工具链、工作习惯)
- ✅ 高价值:用户环境中已有但未被发现/利用的工具和数据源
- ⚠️ 中价值:需要实际动手验证的技术实验(非读文档能解决的)
- ❌ 低价值探索知名工具的基础用法ruff/black/pytest等——AI训练数据已覆盖用户需要时直接问即可
- ❌ 低价值通用benchmark/对比测试(网上随处可查)
### 目标排序
1. **了解用户**学习用户的代码风格、项目结构、工作习惯、兴趣偏好。分析用户亲手写的代码非AI生成从PC文件/目录/浏览器书签推断偏好。这类知识不可替代,直接提升协作质量
2. **环境发现**:扫描用户环境中已有但未被利用的工具/库/数据源/配置,形成可复用操作知识
3. **实用产出与能力扩展**:写脚本/工具解决痛点,更重要的是在已有能力上解锁新能力(如微信发消息→传文件)。能力树每多一个节点,后续所有任务的可能性空间都变大
4. **小众工具挖掘与踩坑预研**寻找冷门实用工具如mootdx优于akshare/tushare同时对AI常推荐但实际有坑的方案做实测对比如md转pdf各库都不行→Edge打印最优。判断标准如果被问到只会推荐大众方案说明该领域值得挖掘。找到后实际安装测试记录真正好用的方案写入记忆
- ✅ 在GitHub/V2EX/吾爱破解/果核剥壳(ghxi.com)/小众论坛挖掘冷门实用工具
- ❌ 刷HN/Reddit热门头条、阅读大众科技新闻AI训练数据已覆盖
5. **自身演进**:思考框架不足,提出改进方案
6. **审查记忆系统**:修正错误或过时记录(低频执行)
> ⚠️ **刷新闻/论坛HackNews等不是有效任务**。公开网页内容属于AI训练数据已覆盖的通用知识不满足价值判断标准。除非用户明确要求否则禁止将「上网浏览」作为自主任务。
### 选择原则
- **个性化优先**优先产出「只有探测这台PC才能获得」的知识而非通用技术知识
- **盲区优先**:探索产出须为自身参数无法复现的知识(小众库发现与用法、环境特有的坑),学已熟知库的基础用法无价值
- **代码风格注意**分析用户代码风格时必须找用户亲手写的老代码大模型出现前的项目memory/下的.py多为AI生成不可作为风格样本
- **自主发现**主动扫描用户环境pip list、项目目录、配置文件发现未知工具而非等用户告知
- **假设驱动**:明确"要验证什么假设",实验必须有动手验证环节
- **禁止低价值验证**:不验证 global_mem 中的静态配置,不做无假设的巡检
主要目标是让你未来更加强大。探索的核心产出是记忆——每次运行应将有价值的发现(用户偏好、环境事实、新知识)整理为记忆更新提案,纳入报告待用户审批后写入。
但不需要你了解自身代码库,目前读取你自身代码意义不大。
严禁调研弱于当前框架Claude Code级的agent/工具,它们已无参考价值。
## 🔄 执行流程
### 阶段 1自主探测用户离开时
- **启动检查**
- 读取可能有的 `./autonomous_reports/history.txt` 了解历史记录。
- **TODO优先**若cwd下存在 `TODO.txt`优先从中选择任务执行任务完成后从TODO.txt中移除对应条目。
- **不连续选择相同方向**TODO任务除外
- **预期收益声明**:选定任务后,必须先用一句话写明「做这个任务预期带来什么收益」。允许探索失败,但必须事先想清楚为什么值得做。这句话写入报告开头。
- **执行方式**:基于目标自由进行,无需预先批准,直接执行只读或实验性操作。
- **约束**小步快跑每次只做一个小任务剩下的下次再做控制在15个回合以内。严禁修改核心记忆/系统设置;严禁读取敏感数据(但可以检测存在性)。
### 阶段 2生成报告与方案
- **位置**:目录若不存在请新建
- 报告文件:`./autonomous_reports/RXX_简短描述.md`XX为自增序号从history.txt末尾推断下一个编号
- 历史索引:`./autonomous_reports/history.txt`每条任务一行报告写完后必须append
- 已处理报告归档至 `./autonomous_reports/archived/`
- **history.txt格式**:请先查看此文件来获取详细格式,`#XX | 日期 | 类型 | 主题 | 结论`(严格单行,禁止换行)
- **篇幅**:默认简洁,仅关键发现详述
### 阶段 3等待批准
- 用户归来后审查报告,决定批准、修改或拒绝方案。
## 权限边界
- **无需批准**:只读探测(扫描文件、查状态、上网冲浪)、工作目录内的写操作/脚本实验。
- **需要批准**:修改 `global_mem.txt`、修改 `../memory/` 下的 SOP、安装软件、触发外部 API、删除非临时文件。
- **绝对禁止**:读取密码/密钥、修改核心代码库、执行不可逆危险操作。
## 避免"只读陷阱"
- ❌ 不要只看不做:发现问题后应创建测试验证
- ✅ 边探测边实验:用临时脚本验证假设
- ✅ 记录实验结果:即使失败也写入报告
- ✅ 完整验证再结论:严禁读部分文件即下判断;必须追踪所有关联文件并实际测试后再写报告
## 📝 探测领域(示例,鼓励发散,不要总盯着技术/agent
- 有效上网冲浪(产出可行动的具体信息,非泛读新闻)
- 🎯 资源站巡检:逛果核剥壳/吾爱破解/什么值得买等→按分类浏览→结合用户需求筛选→产出具体推荐(好用工具、优惠羊毛、高性价比商品、限时机会等)
- 🎯 深度阅读选≤2个话题深入读正文提炼观点或带明确目标搜索。导航受限时立即换方向
- ❌ 禁止:泛采集标题列表、无目标刷新闻头条
- 实用小工具(写脚本解决日常痛点,如批量重命名、格式转换)
- 本地环境健康(磁盘空间、过期大文件、异常进程)
- 自动化优化(发现可自动化的重复操作并原型验证)
- 了解用户从PC上的文件/目录/浏览器书签等推断用户兴趣和偏好,不读密钥文件)
- 推荐(基于对用户的了解,推荐游戏/视频/工具/脚本等,附理由)
- 自身演进(思考框架的不足或新需求,提出改进方案供用户审批)
- SOP/记忆维护(审查脚本可用性、路径有效性,但不要每次都选这个)
- 整理cwd清理临时文件、归档过期产物、检查磁盘占用
## 框架锁定
- 当前agent框架tmwebdriver + code_run + 记忆系统)已是最先进实现。
- 自主行动中严禁探索其他agent框架如browser-use、Cua等除非有重大技术变革消息。