refine memory_cleanup_sop: 4 compression principles, RULES triage, anti-intuitive trigger words, layered placement

This commit is contained in:
Liang Jiaqing
2026-04-18 12:33:41 +08:00
parent 3c2d22b948
commit 11c41e7c4a

View File

@@ -1,35 +1,37 @@
# 记忆整理 SOP
L1唯一目的**存在性**索引:知道什么情况下有什么相关记忆去查
## 核心原则:存在性编码
LLM自身是压缩器+解码器。L1只需让它**意识到某类知识存在**它就能通过tool call自行取用深层内容。
## ROI模型
L1每词每轮付成本但防犯错保险。ROI = (犯错概率 × 代价) / 词数成本
**L1本质用最短词数表达——什么场景下有什么记忆可用存在性**
## 该留的高ROI
- 红线:违反就不可逆,如"禁杀python" → 5词防-100k
- 反直觉触发词没提示想不到读SOP如"HttpOnly" → 4词防任务失败
- 路由指针最小化SOP定位如"vision_sop+vision_api.py"
L1两类内容统一ROI评估
- **存在性指针**指向L2/L3知识的最短触发词
- **行为规则**:不提醒就会犯的错(致命/高频均可只要ROI过门槛
## 该删的低ROI
- 实现细节SOP里已有的"怎么做" → 只留触发词
- 直觉能力:不提醒也能想到 → 0收益
- 冗余L3已覆盖的规则 / L1其他行已含的片段 → 重复交税不值
ROI = (不放这几个词的犯错概率 × 代价) / 每轮词数成本
## 逐条四问
1. 删了它,犯错概率真的上升吗?→ 不上升就删
2. L3 SOP已覆盖→ 有就只留触发词
3. 没这词能自己想到读SOP吗→ 能就删
4. 同样收益,能用更少词吗?→ 能就压缩
## 快速判断
**该留**反直觉触发词——没提示就想不到去查SOP的场景词。如`tmwebdriver_sop(httponly cookie)`:没有`httponly cookie`这个词你不会想到取cookie要查tmwebdriver
**该删**
- 名字翻译:`proxy-pool/(代理池)` → 名字自解释,括号是废词,直接`proxy-pool`即可
- 内容描述:`opencli_sop(66站点CLI,复用Chrome session)` → 实现细节属于SOP内部不是触发场景
- 直觉能力:不提醒也能想到 → 0收益白交每轮成本
- 冗余L3已覆盖的规则 / L1其他行已含的片段
## L1写入检验写之前必过
- "这几个词触发什么场景?" → 答不上来就别写;触发词=场景名(视频内容理解)非工具名(yt-dlp)
- 压缩按场景价值不按字数:触发场景的词一字不删,没独立场景的实现细节才是压缩对象
- 等级匹配红线→RULESSOP索引→L3文件名即可禁加描述词名字自解释的不需要额外触发词L0不塞工具
- 记忆修改是持久性伤害,错误在后续每轮复利 → 整理比日常任务更需谨慎
## 压缩四原则
1. **命名自解释 > 加描述**SOP名能说清的L1不加注释改名的ROI常高于改L1
2. **存在性集合最小描述**:多个相近条目若可被同一上位场景覆盖,用集合名表达这类能力的存在,不必平铺子项。如`qq操作/飞书操作/企微操作``im操作:*_im_sop`;子项名自解释则只列名不翻译
3. **条目 = 场景↔方案存在性**:如`视频理解:yt-dlp取字幕``fofa(资产测绘)`——场景名是触发词,方案名编码存在性;括号内**只放反直觉触发词**,非反直觉的(纯翻译/内容描述/实现细节)全是浪费
4. **分层归位**带行为规则或高频高ROI的条目放上方场景行纯存在性指针归L2/L3平铺列表
## 整理流程
0. 先交付任务再沉淀,禁未完成就写记忆
1. 逐行读insight按|拆片段,每片段标注:红线/触发词/路由/实现细节
2.ROI片段确认L3覆盖后删RULES逐条问"违反就炸还是好习惯"
3. 检查近期犯错经验补遗漏的高ROI触发词
4. 验证总行数≤30
1. 逐行读L1`|`拆片段,先分类:存在性指针 / RULES / 翻译 / 内容描述 / 实现细节 / 冗余
2. 先清RULES逐条问“这是全局高ROI还是特定场景低危险规则
- 全局高ROI →
- 特定场景 / 低危险 → 降级到L3或删除
3. 再清存在性指针:检查是否在表达**场景↔方案存在性**;场景触发词只在**反直觉**时才加,翻译/内容描述/实现细节删掉
4. 检查L3文件名是否自解释能靠改名解决的不靠L1加描述最后验证总行数 ≤ 30
**红线**记忆修改是持久性伤害错误每轮复利。L1只能patch词级别修改禁overwrite
产生误导应及时修正L1或记忆更名