feat: 优化LLM显示、修复API路径、重构自主操作SOP、添加sche_tasks到gitignore

- agentmain.py: LLM列表显示增加backend类型 - sidercall.py: 统一API endpoint路径为/v1/chat/completions - autonomous_operation_sop.md: 重构任务选择逻辑和报告目录规则 - .gitignore: 添加sche_tasks/目录排除 - 移除git追踪的sche_tasks任务报告文件
2026-02-20 11:10:04 +08:00
parent 8329efeb9c
commit 08d6cedc7d
11 changed files with 48 additions and 279 deletions
--- a/memory/autonomous_operation_sop.md
+++ b/memory/autonomous_operation_sop.md
@@ -3,41 +3,48 @@
 授权你进行自主行动，只要不对环境造成副作用都可进行。
 请先选择核心目标，再选择一个小目标进行。最终探测结果形成报告（含操作申请），待用户回来确认后再进行可能的写入或修改操作。

-> **启动时写入工作记忆**：`自主探索｜≤15回合｜只有cwd内可写｜用户不在(问题存报告)｜收尾:重读本SOP确认报告目录+更新history｜产出=报告+记忆提案`
+> **启动时写入工作记忆**：`自主探索｜≤15回合｜只有cwd内可写｜用户不在(问题存报告)｜收尾:重读本SOP确认报告目录+更新报告目录内history｜产出=报告+记忆提案`

-## 🎯 核心目标（按价值优先级排序）
+## 📋 大纲
+- 报告目录与规则
+- 任务选择
+- 执行流程与注意事项

-### 价值判断标准
-任务价值 = **「AI训练数据无法覆盖」×「对未来协作有持久收益」**。
- ✅ 高价值：只有通过物理探测用户环境才能获得的个性化知识（用户偏好、代码风格、项目结构、本地工具链、工作习惯）
- ✅ 高价值：用户环境中已有但未被发现/利用的工具和数据源
- ⚠️ 中价值：需要实际动手验证的技术实验（非读文档能解决的）
- ❌ 低价值：探索知名工具的基础用法（ruff/black/pytest等——AI训练数据已覆盖，用户需要时直接问即可）
- ❌ 低价值：通用benchmark/对比测试（网上随处可查）
+## 报告目录与规则

-### 目标排序
-1. **了解用户**：学习用户的代码风格、项目结构、工作习惯、兴趣偏好。分析用户亲手写的代码（非AI生成），从PC文件/目录/浏览器书签推断偏好。这类知识不可替代，直接提升协作质量
-2. **环境发现**：扫描用户环境中已有但未被利用的工具/库/数据源/配置，形成可复用操作知识
-3. **实用产出与能力扩展**：写脚本/工具解决痛点，更重要的是在已有能力上解锁新能力（如微信发消息→传文件）。能力树每多一个节点，后续所有任务的可能性空间都变大
-4. **小众工具挖掘与踩坑预研**：寻找冷门实用工具（如mootdx优于akshare/tushare），同时对AI常推荐但实际有坑的方案做实测对比（如md转pdf各库都不行→Edge打印最优）。判断标准：如果被问到只会推荐大众方案，说明该领域值得挖掘。找到后实际安装测试，记录真正好用的方案写入记忆
-   - ✅ 在GitHub/V2EX/吾爱破解/果核剥壳(ghxi.com)/小众论坛挖掘冷门实用工具
-   - ❌ 刷HN/Reddit热门头条、阅读大众科技新闻（AI训练数据已覆盖）
+⚠️ 报告目录唯一位置：`./autonomous_reports/`，history.txt 在此目录内，禁止写到其他任何路径。
+报告存于 `./autonomous_reports/`，文件名 `RXX_简短描述.md`（XX从 history.txt 推断自增）。
+完成后在 history.txt 首行 prepend 一条：`#XX | 日期 | 类型 | 主题 | 结论`（严格单行）。已处理报告归档至 `archived/`。
+
+权限边界：
+- 无需批准：只读探测、cwd 内写操作/脚本实验
+- 需要报告：修改 global_mem.txt / memory/ 下 SOP、安装软件、外部 API 调用、删除非临时文件
+- 绝对禁止：读取密钥、修改核心代码库、不可逆危险操作
+
+## 任务选择
+
+价值公式：**「AI训练数据无法覆盖」×「对未来协作有持久收益」**。核心产出是记忆——有价值的发现整理为记忆更新提案纳入报告。
+
+选择规则：
+- cwd下有 `TODO.txt` 时优先执行其中任务，完成后移除条目
+- 不连续选择相同方向（TODO除外），选择前先读 history.txt 了解近期已做方向
+- 选定后先声明一句话预期收益，写入报告开头
+
+目标排序（按价值递减）：
+1. **实用产出与能力扩展**：写工具解决痛点，在已有能力上解锁新能力（能力树每多一个节点，可能性空间变大）
+2. **环境发现**：扫描已有但未利用的工具/库/数据源/配置
+3. **小众工具挖掘**：在GitHub/V2EX/吾爱破解/果核剥壳等找冷门实用工具，实测AI常推荐但有坑的方案
+4. **了解用户与推荐**：分析老代码/PC文件/书签推断偏好，给出个性化推荐（游戏/视频/工具附理由）（低频）
 5. **自身演进**：思考框架不足，提出改进方案
-6. **审查记忆系统**：修正错误或过时记录（低频执行）
+6. **记忆审查**：修正错误或过时记录（低频）

-> ⚠️ **刷新闻/论坛（HackNews等）不是有效任务**。公开网页内容属于AI训练数据已覆盖的通用知识，不满足价值判断标准。除非用户明确要求，否则禁止将「上网浏览」作为自主任务。
+选择原则：个性化优先（只有探测这台PC才能获得的知识）→ 盲区优先（自身参数无法复现的知识）→ 假设驱动（明确要验证什么，边探测边实验）→ 禁止低价值验证（不验证静态配置、不做无假设巡检）

-### 选择原则
- **个性化优先**：优先产出「只有探测这台PC才能获得」的知识，而非通用技术知识
- **盲区优先**：探索产出须为自身参数无法复现的知识（小众库发现与用法、环境特有的坑），学已熟知库的基础用法无价值
- **代码风格注意**：分析用户代码风格时，必须找用户亲手写的老代码（大模型出现前的项目），memory/下的.py多为AI生成不可作为风格样本
- **自主发现**：主动扫描用户环境（pip list、项目目录、配置文件）发现未知工具，而非等用户告知
- **假设驱动**：明确"要验证什么假设"，实验必须有动手验证环节
- **禁止低价值验证**：不验证 global_mem 中的静态配置，不做无假设的巡检
+探测领域（鼓励发散，不要总盯技术/agent）：
+- 有效上网冲浪：资源站巡检（果核剥壳/吾爱破解/什么值得买等→结合需求筛选）、深度阅读（≤2话题读正文提炼）
+- 实用小工具 · 本地环境健康 · 自动化优化 · 了解用户 · 推荐（游戏/视频/工具附理由） · 自身演进 · SOP/记忆维护（别每次都选） · 整理cwd

-主要目标是让你未来更加强大。探索的核心产出是记忆——每次运行应将有价值的发现（用户偏好、环境事实、新知识）整理为记忆更新提案，纳入报告待用户审批后写入。
-但不需要你了解自身代码库，目前读取你自身代码意义不大。
-严禁调研弱于当前框架（Claude Code级）的agent/工具，它们已无参考价值。
+禁区：❌ Hacker News · 刷新闻头条 · 泛采集标题/无目标刷新闻 · 探索知名工具基础用法 · 调研弱于当前框架的agent · 调研其他web自动化/computer use框架 · 读取自身代码库

 ## 🔄 执行流程

@@ -52,8 +59,8 @@

 ### 阶段 2：生成报告与方案
 - **位置**：目录若不存在请新建
-  - 报告文件：`./autonomous_reports/RXX_简短描述.md`（XX为自增序号，从history.txt末尾推断下一个编号）
-  - 历史索引：`./autonomous_reports/history.txt`（每条任务一行，报告写完后必须append）
+  - 报告文件：`./autonomous_reports/RXX_简短描述.md`（XX为自增序号，从history.txt推断下一个编号）
+  - 历史索引：`./autonomous_reports/history.txt`（每条任务一行，报告写完后必须prepend）
  - 已处理报告归档至 `./autonomous_reports/archived/`
 - **history.txt格式**：请先查看此文件来获取详细格式，`#XX | 日期 | 类型 | 主题 | 结论`（严格单行，禁止换行）
 - **篇幅**：默认简洁，仅关键发现详述
@@ -61,30 +68,6 @@
 ### 阶段 3：等待批准
 - 用户归来后审查报告，决定批准、修改或拒绝方案。

-## 权限边界
- **无需批准**：只读探测（扫描文件、查状态、上网冲浪）、工作目录内的写操作/脚本实验。
- **需要批准**：修改 `global_mem.txt`、修改 `../memory/` 下的 SOP、安装软件、触发外部 API、删除非临时文件。
- **绝对禁止**：读取密码/密钥、修改核心代码库、执行不可逆危险操作。
-
-## 避免"只读陷阱"
- ❌ 不要只看不做：发现问题后应创建测试验证
- ✅ 边探测边实验：用临时脚本验证假设
- ✅ 记录实验结果：即使失败也写入报告
- ✅ 完整验证再结论：严禁读部分文件即下判断；必须追踪所有关联文件并实际测试后再写报告
-
-## 📝 探测领域（示例，鼓励发散，不要总盯着技术/agent）
- 有效上网冲浪（产出可行动的具体信息，非泛读新闻）
-  - 🎯 资源站巡检：逛果核剥壳/吾爱破解/什么值得买等→按分类浏览→结合用户需求筛选→产出具体推荐（好用工具、优惠羊毛、高性价比商品、限时机会等）
-  - 🎯 深度阅读：选≤2个话题深入读正文提炼观点，或带明确目标搜索。导航受限时立即换方向
-  - ❌ 禁止：泛采集标题列表、无目标刷新闻头条
- 实用小工具（写脚本解决日常痛点，如批量重命名、格式转换）
- 本地环境健康（磁盘空间、过期大文件、异常进程）
- 自动化优化（发现可自动化的重复操作并原型验证）
- 了解用户（从PC上的文件/目录/浏览器书签等推断用户兴趣和偏好，不读密钥文件）
- 推荐（基于对用户的了解，推荐游戏/视频/工具/脚本等，附理由）
- 自身演进（思考框架的不足或新需求，提出改进方案供用户审批）
- SOP/记忆维护（审查脚本可用性、路径有效性，但不要每次都选这个）
- 整理cwd（清理临时文件、归档过期产物、检查磁盘占用）
-## 框架锁定
- 当前agent框架（tmwebdriver + code_run + 记忆系统）已是最先进实现。
- 自主行动中严禁探索其他agent框架（如browser-use、Cua等），除非有重大技术变革消息。
+### 避免"只读陷阱"
+- 发现问题要动手验证，边探测边实验，用临时脚本测假设
+- 完整验证再结论：禁读部分文件即下判断，必须追踪关联文件并实测后再写报告