From 04b4818f87445d1a2a3b12af7ee0159fd08db472 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E5=AE=8B=E6=98=8E=E6=98=8E?= <songmingming@>
Date: Fri, 17 Apr 2026 15:09:52 +0800
Subject: [PATCH] =?UTF-8?q?fix(llmcore):=20=E6=B7=BB=E5=8A=A0MiniMax?=
 =?UTF-8?q?=E8=B6=85=E6=97=B6=E9=94=99=E8=AF=AF=E7=A0=81529=E6=94=AF?=
 =?UTF-8?q?=E6=8C=81=E9=87=8D=E8=AF=95=E6=9C=BA=E5=88=B6?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

## 问题描述
MiniMax API在请求超时时返回HTTP 529状态码，该状态码未被包含在可重试状态码集合中， 导致即使配置了max_retries参数，重试机制也对MiniMax超时无效。
当前行为：MiniMax 529 → 不重试 → 直接报错
预期行为：MiniMax 529 → 触发重试逻辑 → max_retries生效 ## 解决方案
在llmcore.py的RETRYABLE集合中添加529状态码。 ## 关于其他改动的思考 最初的想法是：将 LLM API 重试的 HTTP 状态码从硬编码提取为可配置文件
assets/http_retry_codes.json，首次运行时自动生成默认配置

### 之前的初衷（配置文件方案）
- ✓ 不修改代码即可适配新的错误码
- ✓ 降低维护成本
### 现实考量（硬编码方案）
- 主流模型厂商就那几家：OpenAI、Claude、MiniMax、Kimi等 -
标准的超时错误码基本固化：408(timeout)、429(rate_limit)、5xx(server_error)
- MiniMax 529是特例但不频繁变化
- 硬编码更简洁直接，维护更清晰

## 受影响范围
- llmcore.py: _openai_stream() 函数的重试机制现在支持MiniMax 529错误
- 对应MiniMax API的超时场景现在能正确触发retry逻辑
---
 llmcore.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/llmcore.py b/llmcore.py
index 395dbf5..6a5e325 100644
--- a/llmcore.py
+++ b/llmcore.py
@@ -282,7 +282,7 @@ def _openai_stream(api_base, api_key, messages, model, api_mode='chat_completion
                 else: resp_tools.append(t)
             payload["tools"] = resp_tools
         else: payload["tools"] = tools
-    RETRYABLE = {408, 409, 425, 429, 500, 502, 503, 504}
+    RETRYABLE = {408, 409, 425, 429, 500, 502, 503, 504, 529}
     def _delay(resp, attempt):
         try: ra = float((resp.headers or {}).get("retry-after"))
         except: ra = None