From 11c41e7c4aceac0f9be0b95af6adb94d11b0c549 Mon Sep 17 00:00:00 2001
From: Liang Jiaqing <l.j.q.light@gmail.com>
Date: Sat, 18 Apr 2026 12:33:41 +0800
Subject: [PATCH] refine memory_cleanup_sop: 4 compression principles, RULES
 triage, anti-intuitive trigger words, layered placement

---
 memory/memory_cleanup_sop.md | 54 +++++++++++++++++++-----------------
 1 file changed, 28 insertions(+), 26 deletions(-)

diff --git a/memory/memory_cleanup_sop.md b/memory/memory_cleanup_sop.md
index a27f406..d0b66dd 100644
--- a/memory/memory_cleanup_sop.md
+++ b/memory/memory_cleanup_sop.md
@@ -1,35 +1,37 @@
 # 记忆整理 SOP
 
-L1唯一目的：**存在性**索引：知道什么情况下有什么相关记忆去查
+## 核心原则：存在性编码
+LLM自身是压缩器+解码器。L1只需让它**意识到某类知识存在**，它就能通过tool call自行取用深层内容。
 
-## ROI模型
-L1每词每轮付成本，但防犯错（保险）。ROI = (犯错概率 × 代价) / 词数成本
+**L1本质：用最短词数表达——什么场景下有什么记忆可用（存在性）。**
 
-## 该留的（高ROI）
-- 红线：违反就不可逆，如"禁杀python" → 5词防-100k
-- 反直觉触发词：没提示想不到读SOP，如"HttpOnly" → 4词防任务失败
-- 路由指针：最小化SOP定位，如"vision_sop+vision_api.py"
+L1两类内容，统一ROI评估：
+- **存在性指针**：指向L2/L3知识的最短触发词
+- **行为规则**：不提醒就会犯的错（致命/高频均可，只要ROI过门槛）
 
-## 该删的（低ROI）
-- 实现细节：SOP里已有的"怎么做" → 只留触发词
-- 直觉能力：不提醒也能想到 → 0收益
-- 冗余：L3已覆盖的规则 / L1其他行已含的片段 → 重复交税不值
+ROI = (不放这几个词的犯错概率 × 代价) / 每轮词数成本
 
-## 逐条四问
-1. 删了它，犯错概率真的上升吗？→ 不上升就删
-2. L3 SOP已覆盖？→ 有就只留触发词
-3. 没这词能自己想到读SOP吗？→ 能就删
-4. 同样收益，能用更少词吗？→ 能就压缩
+## 快速判断
+**该留**：反直觉触发词——没提示就想不到去查SOP的场景词。如`tmwebdriver_sop(httponly cookie)`：没有`httponly cookie`这个词，你不会想到取cookie要查tmwebdriver
+**该删**：
+- 名字翻译：`proxy-pool/(代理池)` → 名字自解释，括号是废词，直接`proxy-pool`即可
+- 内容描述：`opencli_sop(66站点CLI,复用Chrome session)` → 实现细节属于SOP内部，不是触发场景
+- 直觉能力：不提醒也能想到 → 0收益，白交每轮成本
+- 冗余：L3已覆盖的规则 / L1其他行已含的片段
 
-## L1写入检验（写之前必过）
-- "这几个词触发什么场景？" → 答不上来就别写；触发词=场景名(视频内容理解)非工具名(yt-dlp)
-- 压缩按场景价值不按字数：触发场景的词一字不删，没独立场景的实现细节才是压缩对象
-- 等级匹配：红线→RULES，SOP索引→L3文件名即可（禁加描述词）；名字自解释的不需要额外触发词，L0不塞工具
-- 记忆修改是持久性伤害，错误在后续每轮复利 → 整理比日常任务更需谨慎
+## 压缩四原则
+1. **命名自解释 > 加描述**：SOP名能说清的，L1不加注释；改名的ROI常高于改L1
+2. **存在性集合最小描述**：多个相近条目若可被同一上位场景覆盖，用集合名表达这类能力的存在，不必平铺子项。如`qq操作/飞书操作/企微操作`→`im操作:*_im_sop`；子项名自解释则只列名不翻译
+3. **条目 = 场景↔方案存在性**：如`视频理解:yt-dlp取字幕`、`fofa(资产测绘)`——场景名是触发词，方案名编码存在性；括号内**只放反直觉触发词**，非反直觉的（纯翻译/内容描述/实现细节）全是浪费
+4. **分层归位**：带行为规则或高频高ROI的条目放上方场景行，纯存在性指针归L2/L3平铺列表
 
 ## 整理流程
-0. 先交付任务再沉淀，禁未完成就写记忆
-1. 逐行读insight，按|拆片段，每片段标注：红线/触发词/路由/实现细节
-2. 低ROI片段 → 确认L3覆盖后删；RULES逐条问"违反就炸还是好习惯"
-3. 检查近期犯错经验，补遗漏的高ROI触发词
-4. 验证总行数≤30
+1. 逐行读L1，按`|`拆片段，先分类：存在性指针 / RULES / 翻译 / 内容描述 / 实现细节 / 冗余
+2. 先清RULES：逐条问“这是全局高ROI，还是特定场景低危险规则？”
+   - 全局高ROI → 留
+   - 特定场景 / 低危险 → 降级到L3或删除
+3. 再清存在性指针：检查是否在表达**场景↔方案存在性**；场景触发词只在**反直觉**时才加，翻译/内容描述/实现细节删掉
+4. 检查L3文件名是否自解释；能靠改名解决的，不靠L1加描述；最后验证总行数 ≤ 30
+
+**红线**：记忆修改是持久性伤害，错误每轮复利。L1只能patch词级别修改，禁overwrite
+产生误导应及时修正L1或记忆更名