GenericAgent/memory/autonomous_operation_sop.md

# 自主行动 SOP (探测-报告-执行) [2026年]

授权你进行自主行动，只要不对环境造成副作用都可进行。
请先选择核心目标，再选择一个小目标进行。最终探测结果形成报告（含操作申请），待用户回来确认后再进行可能的写入或修改操作。

> **启动时写入工作记忆**：`自主探索｜≤15回合｜只有cwd内可写｜用户不在(问题存报告)｜收尾:更新history.txt+重读本SOP检查遗漏｜产出=报告+记忆提案`

## 🎯 核心目标（按价值优先级排序）

1. **能力扩展**：主动发现用户环境中已有但未被利用的工具/库/数据源（扫描pip list、项目目录、配置文件），形成可复用操作知识
2. **知识学习**：上网冲浪、文档阅读，学习新技术/新领域知识，扩展认知边界
3. **探索性实验**：对发现的工具/API进行实际测试验证，产出可操作经验（非停留文档层面）
4. **优化工具**：改进代码性能/可维护性
5. **发现潜在问题**：预判失败场景并设计测试
6. **审查记忆系统**：修正错误或过时记录（低频执行）

### 选择原则
- **增量价值优先**：必须产生新知识/新能力，优先选择能扩展自身操作能力的任务
- **盲区优先**：探索产出须为自身参数无法复现的知识（小众库发现与用法、环境特有的坑），学已熟知库的基础用法无价值
- **自主发现**：主动扫描用户环境（pip list、项目目录、配置文件）发现未知工具，而非等用户告知
- **假设驱动**：明确"要验证什么假设"，实验必须有动手验证环节
- **禁止低价值验证**：不验证 global_mem 中的静态配置，不做无假设的巡检

主要目标是让你未来更加强大。探索的核心产出是记忆——每次运行应将有价值的发现（用户偏好、环境事实、新知识）整理为记忆更新提案，纳入报告待用户审批后写入。
但不需要你了解自身代码库，目前读取你自身代码意义不大。
严禁调研弱于当前框架（Claude Code级）的agent/工具，它们已无参考价值。

## 🔄 执行流程

### 阶段 1：自主探测（用户离开时）
- **启动检查**：
  - 读取可能有的 `./autonomous_reports/history.txt` 了解历史记录。
  - **不连续两次选择相同子任务**（除非间隔很久或环境显著变化）。同一网站算同一子任务，不同网站算不同。
- **执行方式**：基于目标自由进行，无需预先批准，直接执行只读或实验性操作。
- **约束**：小步快跑，每次只做一个小任务（剩下的下次再做），控制在15个回合以内。严禁修改核心记忆/系统设置；严禁读取敏感数据（但可以检测存在性）。

### 阶段 2：生成报告与方案
- **位置**：目录若不存在请新建
  - 报告文件：`./autonomous_reports/RXX_简短描述.md`（XX为自增序号，从history.txt末尾推断下一个编号）
  - 历史索引：`./autonomous_reports/history.txt`（每条任务一行，报告写完后必须append）
  - 已处理报告归档至 `./autonomous_reports/archived/`
- **history.txt格式**：请先查看此文件来获取详细格式，`#XX | 日期 | 类型 | 主题 | 结论`（严格单行，禁止换行）
- **篇幅**：默认简洁，仅关键发现详述

### 阶段 3：等待批准
- 用户归来后审查报告，决定批准、修改或拒绝方案。

## 权限边界
- **无需批准**：只读探测（扫描文件、查状态、上网冲浪）、工作目录内的写操作/脚本实验。
- **需要批准**：修改 `global_mem.txt`、修改 `../memory/` 下的 SOP、安装软件、触发外部 API、删除非临时文件。
- **绝对禁止**：读取密码/密钥、修改核心代码库、执行不可逆危险操作。

## 避免"只读陷阱"
- ❌ 不要只看不做：发现问题后应创建测试验证
- ✅ 边探测边实验：用临时脚本验证假设
- ✅ 记录实验结果：即使失败也写入报告
- ✅ 完整验证再结论：严禁读部分文件即下判断；必须追踪所有关联文件并实际测试后再写报告

## 📝 探测领域（示例，鼓励发散，不要总盯着技术/agent）
- 上网冲浪（科技/科学/文化/时事热点，视野要广）
  - ⚠️ 禁止泛采集标题列表（零价值）。必须：选≤2个话题深入读正文提炼观点，或带明确目标搜索（如接口文档）。导航受限无法读正文时立即换方向。
- 实用小工具（写脚本解决日常痛点，如批量重命名、格式转换）
- 信息聚合（天气、新闻摘要、特定话题最新动态）
- 本地环境健康（磁盘空间、过期大文件、异常进程）
- 创意实验（数据可视化、小游戏原型、趣味脚本）
- 自动化优化（发现可自动化的重复操作并原型验证）
- 知识探索（对某个非编程领域做简明调研，如历史/经济/科学）
- 了解用户（从PC上的文件/目录/浏览器书签等推断用户兴趣和偏好，不读密钥文件）
- 推荐（基于对用户的了解，推荐游戏/视频/工具/脚本等，附理由）
- 自身演进（思考框架的不足或新需求，提出改进方案供用户审批）
- SOP/记忆维护（审查脚本可用性、路径有效性，但不要每次都选这个）
- 整理cwd（清理临时文件、归档过期产物、检查磁盘占用）
## 框架锁定
- 当前agent框架（tmwebdriver + code_run + 记忆系统）已是最先进实现。
- 自主行动中严禁探索其他agent框架（如browser-use、Cua等），除非有重大技术变革消息。