feat: 优化LLM显示、修复API路径、重构自主操作SOP、添加sche_tasks到gitignore
- agentmain.py: LLM列表显示增加backend类型 - sidercall.py: 统一API endpoint路径为/v1/chat/completions - autonomous_operation_sop.md: 重构任务选择逻辑和报告目录规则 - .gitignore: 添加sche_tasks/目录排除 - 移除git追踪的sche_tasks任务报告文件
This commit is contained in:
@@ -3,41 +3,48 @@
|
||||
授权你进行自主行动,只要不对环境造成副作用都可进行。
|
||||
请先选择核心目标,再选择一个小目标进行。最终探测结果形成报告(含操作申请),待用户回来确认后再进行可能的写入或修改操作。
|
||||
|
||||
> **启动时写入工作记忆**:`自主探索|≤15回合|只有cwd内可写|用户不在(问题存报告)|收尾:重读本SOP确认报告目录+更新history|产出=报告+记忆提案`
|
||||
> **启动时写入工作记忆**:`自主探索|≤15回合|只有cwd内可写|用户不在(问题存报告)|收尾:重读本SOP确认报告目录+更新报告目录内history|产出=报告+记忆提案`
|
||||
|
||||
## 🎯 核心目标(按价值优先级排序)
|
||||
## 📋 大纲
|
||||
- 报告目录与规则
|
||||
- 任务选择
|
||||
- 执行流程与注意事项
|
||||
|
||||
### 价值判断标准
|
||||
任务价值 = **「AI训练数据无法覆盖」×「对未来协作有持久收益」**。
|
||||
- ✅ 高价值:只有通过物理探测用户环境才能获得的个性化知识(用户偏好、代码风格、项目结构、本地工具链、工作习惯)
|
||||
- ✅ 高价值:用户环境中已有但未被发现/利用的工具和数据源
|
||||
- ⚠️ 中价值:需要实际动手验证的技术实验(非读文档能解决的)
|
||||
- ❌ 低价值:探索知名工具的基础用法(ruff/black/pytest等——AI训练数据已覆盖,用户需要时直接问即可)
|
||||
- ❌ 低价值:通用benchmark/对比测试(网上随处可查)
|
||||
## 报告目录与规则
|
||||
|
||||
### 目标排序
|
||||
1. **了解用户**:学习用户的代码风格、项目结构、工作习惯、兴趣偏好。分析用户亲手写的代码(非AI生成),从PC文件/目录/浏览器书签推断偏好。这类知识不可替代,直接提升协作质量
|
||||
2. **环境发现**:扫描用户环境中已有但未被利用的工具/库/数据源/配置,形成可复用操作知识
|
||||
3. **实用产出与能力扩展**:写脚本/工具解决痛点,更重要的是在已有能力上解锁新能力(如微信发消息→传文件)。能力树每多一个节点,后续所有任务的可能性空间都变大
|
||||
4. **小众工具挖掘与踩坑预研**:寻找冷门实用工具(如mootdx优于akshare/tushare),同时对AI常推荐但实际有坑的方案做实测对比(如md转pdf各库都不行→Edge打印最优)。判断标准:如果被问到只会推荐大众方案,说明该领域值得挖掘。找到后实际安装测试,记录真正好用的方案写入记忆
|
||||
- ✅ 在GitHub/V2EX/吾爱破解/果核剥壳(ghxi.com)/小众论坛挖掘冷门实用工具
|
||||
- ❌ 刷HN/Reddit热门头条、阅读大众科技新闻(AI训练数据已覆盖)
|
||||
⚠️ 报告目录唯一位置:`./autonomous_reports/`,history.txt 在此目录内,禁止写到其他任何路径。
|
||||
报告存于 `./autonomous_reports/`,文件名 `RXX_简短描述.md`(XX从 history.txt 推断自增)。
|
||||
完成后在 history.txt 首行 prepend 一条:`#XX | 日期 | 类型 | 主题 | 结论`(严格单行)。已处理报告归档至 `archived/`。
|
||||
|
||||
权限边界:
|
||||
- 无需批准:只读探测、cwd 内写操作/脚本实验
|
||||
- 需要报告:修改 global_mem.txt / memory/ 下 SOP、安装软件、外部 API 调用、删除非临时文件
|
||||
- 绝对禁止:读取密钥、修改核心代码库、不可逆危险操作
|
||||
|
||||
## 任务选择
|
||||
|
||||
价值公式:**「AI训练数据无法覆盖」×「对未来协作有持久收益」**。核心产出是记忆——有价值的发现整理为记忆更新提案纳入报告。
|
||||
|
||||
选择规则:
|
||||
- cwd下有 `TODO.txt` 时优先执行其中任务,完成后移除条目
|
||||
- 不连续选择相同方向(TODO除外),选择前先读 history.txt 了解近期已做方向
|
||||
- 选定后先声明一句话预期收益,写入报告开头
|
||||
|
||||
目标排序(按价值递减):
|
||||
1. **实用产出与能力扩展**:写工具解决痛点,在已有能力上解锁新能力(能力树每多一个节点,可能性空间变大)
|
||||
2. **环境发现**:扫描已有但未利用的工具/库/数据源/配置
|
||||
3. **小众工具挖掘**:在GitHub/V2EX/吾爱破解/果核剥壳等找冷门实用工具,实测AI常推荐但有坑的方案
|
||||
4. **了解用户与推荐**:分析老代码/PC文件/书签推断偏好,给出个性化推荐(游戏/视频/工具附理由)(低频)
|
||||
5. **自身演进**:思考框架不足,提出改进方案
|
||||
6. **审查记忆系统**:修正错误或过时记录(低频执行)
|
||||
6. **记忆审查**:修正错误或过时记录(低频)
|
||||
|
||||
> ⚠️ **刷新闻/论坛(HackNews等)不是有效任务**。公开网页内容属于AI训练数据已覆盖的通用知识,不满足价值判断标准。除非用户明确要求,否则禁止将「上网浏览」作为自主任务。
|
||||
选择原则:个性化优先(只有探测这台PC才能获得的知识)→ 盲区优先(自身参数无法复现的知识)→ 假设驱动(明确要验证什么,边探测边实验)→ 禁止低价值验证(不验证静态配置、不做无假设巡检)
|
||||
|
||||
### 选择原则
|
||||
- **个性化优先**:优先产出「只有探测这台PC才能获得」的知识,而非通用技术知识
|
||||
- **盲区优先**:探索产出须为自身参数无法复现的知识(小众库发现与用法、环境特有的坑),学已熟知库的基础用法无价值
|
||||
- **代码风格注意**:分析用户代码风格时,必须找用户亲手写的老代码(大模型出现前的项目),memory/下的.py多为AI生成不可作为风格样本
|
||||
- **自主发现**:主动扫描用户环境(pip list、项目目录、配置文件)发现未知工具,而非等用户告知
|
||||
- **假设驱动**:明确"要验证什么假设",实验必须有动手验证环节
|
||||
- **禁止低价值验证**:不验证 global_mem 中的静态配置,不做无假设的巡检
|
||||
探测领域(鼓励发散,不要总盯技术/agent):
|
||||
- 有效上网冲浪:资源站巡检(果核剥壳/吾爱破解/什么值得买等→结合需求筛选)、深度阅读(≤2话题读正文提炼)
|
||||
- 实用小工具 · 本地环境健康 · 自动化优化 · 了解用户 · 推荐(游戏/视频/工具附理由) · 自身演进 · SOP/记忆维护(别每次都选) · 整理cwd
|
||||
|
||||
主要目标是让你未来更加强大。探索的核心产出是记忆——每次运行应将有价值的发现(用户偏好、环境事实、新知识)整理为记忆更新提案,纳入报告待用户审批后写入。
|
||||
但不需要你了解自身代码库,目前读取你自身代码意义不大。
|
||||
严禁调研弱于当前框架(Claude Code级)的agent/工具,它们已无参考价值。
|
||||
禁区:❌ Hacker News · 刷新闻头条 · 泛采集标题/无目标刷新闻 · 探索知名工具基础用法 · 调研弱于当前框架的agent · 调研其他web自动化/computer use框架 · 读取自身代码库
|
||||
|
||||
## 🔄 执行流程
|
||||
|
||||
@@ -52,8 +59,8 @@
|
||||
|
||||
### 阶段 2:生成报告与方案
|
||||
- **位置**:目录若不存在请新建
|
||||
- 报告文件:`./autonomous_reports/RXX_简短描述.md`(XX为自增序号,从history.txt末尾推断下一个编号)
|
||||
- 历史索引:`./autonomous_reports/history.txt`(每条任务一行,报告写完后必须append)
|
||||
- 报告文件:`./autonomous_reports/RXX_简短描述.md`(XX为自增序号,从history.txt推断下一个编号)
|
||||
- 历史索引:`./autonomous_reports/history.txt`(每条任务一行,报告写完后必须prepend)
|
||||
- 已处理报告归档至 `./autonomous_reports/archived/`
|
||||
- **history.txt格式**:请先查看此文件来获取详细格式,`#XX | 日期 | 类型 | 主题 | 结论`(严格单行,禁止换行)
|
||||
- **篇幅**:默认简洁,仅关键发现详述
|
||||
@@ -61,30 +68,6 @@
|
||||
### 阶段 3:等待批准
|
||||
- 用户归来后审查报告,决定批准、修改或拒绝方案。
|
||||
|
||||
## 权限边界
|
||||
- **无需批准**:只读探测(扫描文件、查状态、上网冲浪)、工作目录内的写操作/脚本实验。
|
||||
- **需要批准**:修改 `global_mem.txt`、修改 `../memory/` 下的 SOP、安装软件、触发外部 API、删除非临时文件。
|
||||
- **绝对禁止**:读取密码/密钥、修改核心代码库、执行不可逆危险操作。
|
||||
|
||||
## 避免"只读陷阱"
|
||||
- ❌ 不要只看不做:发现问题后应创建测试验证
|
||||
- ✅ 边探测边实验:用临时脚本验证假设
|
||||
- ✅ 记录实验结果:即使失败也写入报告
|
||||
- ✅ 完整验证再结论:严禁读部分文件即下判断;必须追踪所有关联文件并实际测试后再写报告
|
||||
|
||||
## 📝 探测领域(示例,鼓励发散,不要总盯着技术/agent)
|
||||
- 有效上网冲浪(产出可行动的具体信息,非泛读新闻)
|
||||
- 🎯 资源站巡检:逛果核剥壳/吾爱破解/什么值得买等→按分类浏览→结合用户需求筛选→产出具体推荐(好用工具、优惠羊毛、高性价比商品、限时机会等)
|
||||
- 🎯 深度阅读:选≤2个话题深入读正文提炼观点,或带明确目标搜索。导航受限时立即换方向
|
||||
- ❌ 禁止:泛采集标题列表、无目标刷新闻头条
|
||||
- 实用小工具(写脚本解决日常痛点,如批量重命名、格式转换)
|
||||
- 本地环境健康(磁盘空间、过期大文件、异常进程)
|
||||
- 自动化优化(发现可自动化的重复操作并原型验证)
|
||||
- 了解用户(从PC上的文件/目录/浏览器书签等推断用户兴趣和偏好,不读密钥文件)
|
||||
- 推荐(基于对用户的了解,推荐游戏/视频/工具/脚本等,附理由)
|
||||
- 自身演进(思考框架的不足或新需求,提出改进方案供用户审批)
|
||||
- SOP/记忆维护(审查脚本可用性、路径有效性,但不要每次都选这个)
|
||||
- 整理cwd(清理临时文件、归档过期产物、检查磁盘占用)
|
||||
## 框架锁定
|
||||
- 当前agent框架(tmwebdriver + code_run + 记忆系统)已是最先进实现。
|
||||
- 自主行动中严禁探索其他agent框架(如browser-use、Cua等),除非有重大技术变革消息。
|
||||
### 避免"只读陷阱"
|
||||
- 发现问题要动手验证,边探测边实验,用临时脚本测假设
|
||||
- 完整验证再结论:禁读部分文件即下判断,必须追踪关联文件并实测后再写报告
|
||||
|
||||
Reference in New Issue
Block a user