From 11c41e7c4aceac0f9be0b95af6adb94d11b0c549 Mon Sep 17 00:00:00 2001 From: Liang Jiaqing Date: Sat, 18 Apr 2026 12:33:41 +0800 Subject: [PATCH] refine memory_cleanup_sop: 4 compression principles, RULES triage, anti-intuitive trigger words, layered placement --- memory/memory_cleanup_sop.md | 54 +++++++++++++++++++----------------- 1 file changed, 28 insertions(+), 26 deletions(-) diff --git a/memory/memory_cleanup_sop.md b/memory/memory_cleanup_sop.md index a27f406..d0b66dd 100644 --- a/memory/memory_cleanup_sop.md +++ b/memory/memory_cleanup_sop.md @@ -1,35 +1,37 @@ # 记忆整理 SOP -L1唯一目的:**存在性**索引:知道什么情况下有什么相关记忆去查 +## 核心原则:存在性编码 +LLM自身是压缩器+解码器。L1只需让它**意识到某类知识存在**,它就能通过tool call自行取用深层内容。 -## ROI模型 -L1每词每轮付成本,但防犯错(保险)。ROI = (犯错概率 × 代价) / 词数成本 +**L1本质:用最短词数表达——什么场景下有什么记忆可用(存在性)。** -## 该留的(高ROI) -- 红线:违反就不可逆,如"禁杀python" → 5词防-100k -- 反直觉触发词:没提示想不到读SOP,如"HttpOnly" → 4词防任务失败 -- 路由指针:最小化SOP定位,如"vision_sop+vision_api.py" +L1两类内容,统一ROI评估: +- **存在性指针**:指向L2/L3知识的最短触发词 +- **行为规则**:不提醒就会犯的错(致命/高频均可,只要ROI过门槛) -## 该删的(低ROI) -- 实现细节:SOP里已有的"怎么做" → 只留触发词 -- 直觉能力:不提醒也能想到 → 0收益 -- 冗余:L3已覆盖的规则 / L1其他行已含的片段 → 重复交税不值 +ROI = (不放这几个词的犯错概率 × 代价) / 每轮词数成本 -## 逐条四问 -1. 删了它,犯错概率真的上升吗?→ 不上升就删 -2. L3 SOP已覆盖?→ 有就只留触发词 -3. 没这词能自己想到读SOP吗?→ 能就删 -4. 同样收益,能用更少词吗?→ 能就压缩 +## 快速判断 +**该留**:反直觉触发词——没提示就想不到去查SOP的场景词。如`tmwebdriver_sop(httponly cookie)`:没有`httponly cookie`这个词,你不会想到取cookie要查tmwebdriver +**该删**: +- 名字翻译:`proxy-pool/(代理池)` → 名字自解释,括号是废词,直接`proxy-pool`即可 +- 内容描述:`opencli_sop(66站点CLI,复用Chrome session)` → 实现细节属于SOP内部,不是触发场景 +- 直觉能力:不提醒也能想到 → 0收益,白交每轮成本 +- 冗余:L3已覆盖的规则 / L1其他行已含的片段 -## L1写入检验(写之前必过) -- "这几个词触发什么场景?" → 答不上来就别写;触发词=场景名(视频内容理解)非工具名(yt-dlp) -- 压缩按场景价值不按字数:触发场景的词一字不删,没独立场景的实现细节才是压缩对象 -- 等级匹配:红线→RULES,SOP索引→L3文件名即可(禁加描述词);名字自解释的不需要额外触发词,L0不塞工具 -- 记忆修改是持久性伤害,错误在后续每轮复利 → 整理比日常任务更需谨慎 +## 压缩四原则 +1. **命名自解释 > 加描述**:SOP名能说清的,L1不加注释;改名的ROI常高于改L1 +2. **存在性集合最小描述**:多个相近条目若可被同一上位场景覆盖,用集合名表达这类能力的存在,不必平铺子项。如`qq操作/飞书操作/企微操作`→`im操作:*_im_sop`;子项名自解释则只列名不翻译 +3. **条目 = 场景↔方案存在性**:如`视频理解:yt-dlp取字幕`、`fofa(资产测绘)`——场景名是触发词,方案名编码存在性;括号内**只放反直觉触发词**,非反直觉的(纯翻译/内容描述/实现细节)全是浪费 +4. **分层归位**:带行为规则或高频高ROI的条目放上方场景行,纯存在性指针归L2/L3平铺列表 ## 整理流程 -0. 先交付任务再沉淀,禁未完成就写记忆 -1. 逐行读insight,按|拆片段,每片段标注:红线/触发词/路由/实现细节 -2. 低ROI片段 → 确认L3覆盖后删;RULES逐条问"违反就炸还是好习惯" -3. 检查近期犯错经验,补遗漏的高ROI触发词 -4. 验证总行数≤30 +1. 逐行读L1,按`|`拆片段,先分类:存在性指针 / RULES / 翻译 / 内容描述 / 实现细节 / 冗余 +2. 先清RULES:逐条问“这是全局高ROI,还是特定场景低危险规则?” + - 全局高ROI → 留 + - 特定场景 / 低危险 → 降级到L3或删除 +3. 再清存在性指针:检查是否在表达**场景↔方案存在性**;场景触发词只在**反直觉**时才加,翻译/内容描述/实现细节删掉 +4. 检查L3文件名是否自解释;能靠改名解决的,不靠L1加描述;最后验证总行数 ≤ 30 + +**红线**:记忆修改是持久性伤害,错误每轮复利。L1只能patch词级别修改,禁overwrite +产生误导应及时修正L1或记忆更名