Files
GenericAgent/memory/subagent_sop.md

3.1 KiB
Raw Blame History

Subagent 调用 SOP

Task Mode 文件IO协议

  • 目录:temp/{task_name}/相对代码根GenericAgent/主agent cwd在temp/时即 ./{task_name}/
  • 启动:python agentmain.py --task {task_name} [--llm_no N]cwd=代码根)
  • 流程:写 input.txt → 启动 → 轮询 output.txt → 读回复 → 写 reply.txt 继续 → 不写则5min自动退出
  • input.txt原则写目标+约束可指定SOP名。禁写具体实现步骤——除非主agent已读过该SOP确认正确。凭印象猜的步骤会误导subagent
  • output.txt首轮对话的流式输出持续append用mtime/size判断更新
  • output1.txt, output2.txt...reply后各轮的流式输出递增编号同样持续append

后台调用要点

task_dir = os.path.join(agent_root, 'temp', task_name)
proc = subprocess.Popen(
    [sys.executable, 'agentmain.py', '--task', task_name],
    cwd=agent_root, creationflags=0x08000000,
    stdout=open(os.path.join(task_dir, 'stdout.log'), 'w', encoding='utf-8'),
    stderr=open(os.path.join(task_dir, 'stderr.log'), 'w', encoding='utf-8'))
  • 必须 Popen禁止 subprocess.run会阻塞
  • stdout.log/stderr.log 用于调试subagent卡死、LLM调用失败等问题
  • 文件统一 UTF-8subagent 无 reply 5min 自动退出无需清理
  • 禁止合并启动+轮询到同一个code_run——会阻塞自己。启动Popen立即返回下一轮再poll output.txt。这是并行的前提
  • 新建/复用任务目录时,先删除旧 output*.txt否则会读到上次结果误判完成

场景1测试模式 - 行为验证

用途观察agent真实行为修正RULES/L2/L3/SOP 流程创建test_path/写input.txt→启动subagent→轮询output.txt(2秒间隔)→验证→清理重复 测试原则:只给目标,不提示位置/不诱导做法,观察自主选择 修正闭环:发现问题→设计测试→定位根源(RULES/L2/L3/SOP)→patch修正→验证 技术要点Insight优先级>SOPsubagent的cwd=temp/ 两种测试

  • 测SOP质量input指定SOP名如"用ezgmail_sop查看最近3封未读邮件"排除导航干扰失败即SOP问题
  • 测导航能力input只写目标验证subagent能自主从insight找到正确SOP。禁止内联SOP内容

场景2Map模式 - 并行处理

用途将N个独立同构子任务分发给各自的subagent处理 核心优势独立上下文。避免处理文档A的长上下文污染处理文档B的质量 约束

  • 文件系统共享是优点不同agent处理不同输入文件产生不同输出文件
  • 共享资源冲突:键鼠/浏览器主体不可共享浏览器可分tab但需谨慎subagent任务应限于文件处理
  • 不满足map模式的任务 → 主agent顺序执行即可别用subagent 标准流程map-reduce
  1. 主agent准备阶段爬取/dump数据存为多个独立输入文件
  2. 分发对每个文件启动一个subagent处理主agent自己也可以处理其中一个
  3. 收集等所有subagent完成主agent读取各输出文件汇总结果