1

2026-03-30 21:03:20 +08:00 · 2026-03-30 21:03:20 +08:00 · 8c2edd8cbe
parent 3a145075ef
commit 8c2edd8cbe
19 changed files with 871 additions and 94 deletions
--- a/AGENTS.md
+++ b/AGENTS.md
@ -1,5 +1,5 @@
 ## 项目概述
- **名称**: 初中数学作业批改工作流
+- **名称**: 初中物理作业批改工作流
 - **功能**: 上传多学生的作业图片和Word答案文件，自动识别学生答案、提取标准答案、精准批改并返回每个学生的批改结果JSON

 ### 数据结构（重要变更）
@ -25,6 +25,7 @@
    }
  ],
  "answer_doc_url": "答案文档URL（可选）",
+  "subject": "physics",
  "comment_max_length": 100,
  "max_concurrent": 10
 }
@ -72,9 +73,11 @@
 ## 技能使用
 - 节点 `recognize_and_correct` 使用大语言模型技能（多模态，识别+批改合并）
  - 模型：`doubao-seed-2-0-pro-260215`（旗舰视觉模型，推理能力强，输出简洁）
+  - **客户端**：使用 `utils/llm_client.py`（封装OpenAI SDK，兼容火山引擎/OpenAI等）
 - 节点 `doc_extract` 使用大语言模型技能
  - 模型：`doubao-seed-2-0-pro-260215`（旗舰模型，复杂推理能力强）
  - 使用 python-docx 解析 Word 文档
+  - **客户端**：使用 `utils/llm_client.py`（封装OpenAI SDK）
  - **缓存优化**：使用 `utils/cache_manager.py` 缓存解析结果，有效期30天

 ## 缓存机制（优化版 v2026-03-28）
@ -84,7 +87,9 @@
  - 文件缓存：持久化存储，进程重启后仍可用
 - **缓存有效期**：30天（自动清理过期缓存）
 - **缓存内容**：AI解析后的结构化数据（CorrectAnswer列表）
- **缓存键**：answer_doc_url（MD5哈希）
+- **缓存键**：`{subject}:{answer_doc_url}`（MD5哈希）
+  - **学科隔离**：相同URL在不同学科下不会冲突
+  - 示例：`physics:https://example.com/answer.docx` 和 `math:https://example.com/answer.docx` 是不同的缓存
 - **线程安全**：使用锁保护并发访问
 - **异常安全**：文件缓存失败时自动降级为纯内存模式
 - **统计功能**：`get_stats()` 返回缓存统计信息
@ -183,6 +188,9 @@
    - `student_name`: 学生姓名（str，可选）
    - `homework_images`: 该学生的作业图片URL列表（List[str]，纯字符串数组）
 - `answer_doc_url`: 正确答案Word文件的URL（.docx格式，**可选**）
+- `subject`: 学科标识（str，**可选**，默认"physics"）
+  - 用于缓存隔离，相同URL在不同学科下不会冲突
+  - 支持值：physics、math、chinese、english 等
 - `comment_max_length`: 评语最大字数（默认100字，**可选**）
 - `max_concurrent`: 并行批改的最大数量（默认10，**可选**）
 - `grade_standards`: 评价等级标准（**可选**，默认值如下）
@ -213,10 +221,10 @@
   - 当提供了`answer_doc_url`且在文档中找到对应题目时
   - 严格按照标准答案判断学生答案正误

-2. **降级方案**：使用专业数学老师批改
+2. **降级方案**：使用专业物理老师批改
   - 场景1：未提供`answer_doc_url`
   - 场景2：提供了URL但文档中未找到对应题目
-   - 使用专业数学老师的经验自主判断答案正误
+   - 使用专业物理老师的经验自主判断答案正误

 ### 功能说明
 1. **多图片支持**：可上传多张作业图片，系统会并行处理每张图片（并发数限制为3）
@ -226,6 +234,32 @@
 5. **智能降级**：无标准答案时自动切换到专业老师模式

 ## 优化记录
+### 2026-03-28 缓存键加入学科标识（重要）
+**问题**：相同URL在不同学科下会使用相同的缓存，导致答案解析结果冲突
+
+**修复内容**：
+1. **新增 `subject` 参数**：
+   - 默认值：`physics`
+   - 支持值：physics、math、chinese、english 等
+   
+2. **修改缓存键生成逻辑**：
+   ```python
+   # 修改前
+   cache_key = answer_doc_url
+   
+   # 修改后
+   cache_key = f"{subject}:{answer_doc_url}"
+   ```
+
+3. **缓存隔离效果**：
+   - `physics:https://example.com/answer.docx`
+   - `math:https://example.com/answer.docx`
+   - 两个缓存完全独立，不会冲突
+
+**效果**：
+- 相同URL在不同学科下可以有不同的解析结果
+- 缓存数据按学科隔离，更加灵活
+
 ### 2026-03-27 最终图片处理方案（重要）
 **问题**：如何在不上传图片的前提下，保证AI识别准确？

@ -649,9 +683,9 @@ mark_x = answer_bbox[2] + 10  # 紧贴答案框
 **效果**：用户可根据服务器性能和网络情况灵活调整并发数

 ### 2026-03-26 学科变更
-**修改**：将所有"物理"改为"数学"
- 节点描述：物理作业 → 数学作业
- Prompt中的学科引用：物理 → 数学
+**修改**：将所有"数学"改为"物理"
+- 节点描述：数学作业 → 物理作业
+- Prompt中的学科引用：数学 → 物理
 - 配置文件说明更新

 ### 2026-03-25 多图片并行处理优化
--- a/DEPLOYMENT_GUIDE.md
+++ b/DEPLOYMENT_GUIDE.md
@ -151,35 +151,32 @@ export LLM_MODEL_NAME="gpt-4o"

 ### 3. 修改代码适配自己的环境

-#### 修改 LLM 调用逻辑
+**⚠️ 重要：必须修改 LLM 调用逻辑**

-项目使用了 `coze-coding-dev-sdk`，需要修改为直接调用 OpenAI API：
+项目原使用了 `coze-coding-dev-sdk`（Coze平台专用），**必须替换为标准 OpenAI SDK**。

-**修改文件**: `src/graphs/nodes/doc_extract_node.py`、`src/graphs/nodes/recognize_and_correct_node.py`
+**✅ 已提供替代方案**：我们已创建 `src/utils/llm_client.py`，封装了标准 OpenAI SDK。

-**原代码**（使用 coze-coding-dev-sdk）：
-```python
-from coze_coding_dev_sdk import LLM
+**修改步骤（已完成）**：

-llm = LLM()
-response = llm.invoke(messages)
-```
+1. **创建自定义LLM客户端**：`src/utils/llm_client.py` ✅
+   - 使用标准 OpenAI SDK
+   - 兼容原代码接口
+   - 支持火山引擎/OpenAI/其他兼容API

-**修改为**（直接使用 OpenAI SDK）：
-```python
-import os
-from openai import OpenAI
+2. **修改导入语句**（已完成）：
+   - `src/graphs/nodes/recognize_and_correct_node.py` ✅
+   - `src/graphs/nodes/doc_extract_node.py` ✅
+   
+   ```python
+   # 修改前（原代码）
+   from coze_coding_dev_sdk import LLMClient
+   
+   # 修改后（新代码）
+   from utils.llm_client import LLMClient
+   ```

-client = OpenAI(
-    api_key=os.getenv("LLM_API_KEY"),
-    base_url=os.getenv("LLM_BASE_URL")
-)
-
-response = client.chat.completions.create(
-    model=os.getenv("LLM_MODEL_NAME"),
-    messages=messages
-)
-```
+**无需手动修改**：代码已经更新完成，直接部署即可。

 #### ~~修改对象存储逻辑~~（不需要）

@ -344,7 +341,31 @@ source ~/.bashrc
 LLM_API_KEY="your-api-key" python src/main.py -m http -p 8000
 ```

-### Q4: 如何测试工作流是否正常？
+### Q4: 报错 "S3对象不存在" 或图片URL返回404
+
+**原因**: 图片URL不可访问
+
+**检查清单**：
+1. ✅ 图片URL是否有效（在浏览器中打开测试）
+2. ✅ URL是否需要认证（检查是否有权限）
+3. ✅ URL是否已过期（部分临时URL有时效性）
+4. ✅ URL格式是否正确（http:// 或 https:// 开头）
+
+**解决方案**：
+```bash
+# 测试图片URL是否可访问
+curl -I "https://your-image-url.com/image.jpg"
+
+# 如果返回404，说明URL无效或已过期
+# 需要重新上传图片获取新的URL
+```
+
+**支持的图片格式**：
+- ✅ 公开的HTTP/HTTPS URL（推荐）
+- ❌ 需要认证的URL（需先下载到公开存储）
+- ❌ 本地文件路径（需上传到网络存储）
+
+### Q5: 如何测试工作流是否正常？

 使用 curl 发送测试请求：

@ -363,7 +384,7 @@ curl -X POST http://localhost:8000/run \
  }'
 ```

-### Q5: 如何查看运行日志？
+### Q6: 如何查看运行日志？

 ```bash
 # 实时查看日志
@ -373,14 +394,14 @@ tail -f /app/work/logs/bypass/app.log
 docker logs -f homework-correction
 ```

-### Q6: 性能优化建议
+### Q7: 性能优化建议

 1. **并发控制**: 调整 `max_concurrent` 参数（默认10）
 2. **超时设置**: 修改 `SINGLE_IMAGE_TIMEOUT` 常量（默认120秒）
 3. **缓存优化**: 定期清理 `/tmp/cache` 目录
 4. **资源监控**: 使用 `htop` 或 `docker stats` 监控资源使用

-### Q7: 如何替换为其他 LLM 模型？
+### Q8: 如何替换为其他 LLM 模型？

 1. 修改环境变量：
 ```bash
--- a/config/comprehensive_correction_cfg.json
+++ b/config/comprehensive_correction_cfg.json
@ -7,6 +7,6 @@
        "thinking": "disabled"
    },
    "tools": [],
-    "sp": "你是一位专业的初中数学教师，负责批改学生的数学作业。",
+    "sp": "你是一位专业的初中物理教师，负责批改学生的物理作业。",
    "up": "请按照要求完成作业批改任务。"
 }
--- a/config/correction_judge_llm_cfg.json
+++ b/config/correction_judge_llm_cfg.json
@ -12,6 +12,6 @@
        "model": "doubao-seed-2-0-pro-260215"
    },
    "tools": [],
-    "sp": "你是一位资深的初中数学特级教师，拥有20年以上教学经验，擅长精准批改学生的数学作业。\n\n【核心能力】\n1. **精确判断能力**：对选择题、填空题、解答题都能做出准确的正误判断\n2. **严谨推理能力**：能够逐步验证学生的计算过程和结论\n3. **双模式批改**：\n   - **标准答案模式**：严格按照提供的标准答案判断（最优先）\n   - **专业老师模式**：无标准答案时，凭借专业经验自主判断\n\n【批改原则】\n- 客观公正：严格按照标准答案判断，不主观臆断（有标准答案时）\n- 专业严谨：无标准答案时，使用专业知识验证学生答案\n- 肯定正确：如果学生答案正确，必须给予满分和肯定评语\n- 指出错误：如果学生答案错误，说明具体错误原因并给出正确答案\n\n【优先级规则】\n1. 最优先：使用提供的标准答案批改\n2. 降级：标准答案中未找到对应题目时，使用专业老师批改",
-    "up": "请批改以下学生的数学作业，判断每道题答案的正误并给出详细评语。"
+    "sp": "你是一位资深的初中物理特级教师，拥有20年以上教学经验，擅长精准批改学生的物理作业。\n\n【核心能力】\n1. **精确判断能力**：对选择题、填空题、解答题都能做出准确的正误判断\n2. **严谨推理能力**：能够逐步验证学生的计算过程和结论\n3. **双模式批改**：\n   - **标准答案模式**：严格按照提供的标准答案判断（最优先）\n   - **专业老师模式**：无标准答案时，凭借专业经验自主判断\n\n【批改原则】\n- 客观公正：严格按照标准答案判断，不主观臆断（有标准答案时）\n- 专业严谨：无标准答案时，使用专业知识验证学生答案\n- 肯定正确：如果学生答案正确，必须给予满分和肯定评语\n- 指出错误：如果学生答案错误，说明具体错误原因并给出正确答案\n\n【优先级规则】\n1. 最优先：使用提供的标准答案批改\n2. 降级：标准答案中未找到对应题目时，使用专业老师批改",
+    "up": "请批改以下学生的物理作业，判断每道题答案的正误并给出详细评语。"
 }
--- a/config/doc_extract_llm_cfg.json
+++ b/config/doc_extract_llm_cfg.json
@ -12,6 +12,6 @@
        "model": "doubao-seed-2-0-pro-260215"
    },
    "tools": [],
-    "sp": "你是一位资深的初中数学教师，擅长从试卷中提取题目和标准答案。你的核心能力：\n\n1. **题目识别能力**：能够准确识别试卷中的所有题目，包括大题和小题\n2. **答案提取能力**：能够准确提取每道题的标准答案\n3. **结构化输出能力**：能够将提取的内容组织成结构化的JSON格式\n\n【提取原则】\n- 完整性：不遗漏任何题目\n- 准确性：答案提取要精确\n- 规范性：题号格式统一\n- 清晰性：题干和答案分离明确",
+    "sp": "你是一位资深的初中物理教师，擅长从试卷中提取题目和标准答案。你的核心能力：\n\n1. **题目识别能力**：能够准确识别试卷中的所有题目，包括大题和小题\n2. **答案提取能力**：能够准确提取每道题的标准答案\n3. **结构化输出能力**：能够将提取的内容组织成结构化的JSON格式\n\n【提取原则】\n- 完整性：不遗漏任何题目\n- 准确性：答案提取要精确\n- 规范性：题号格式统一\n- 清晰性：题干和答案分离明确",
    "up": "请从word内容中提取所有题目的题干和标准答案，返回JSON格式结果。"
 }
--- a/config/homework_correction_cfg.json
+++ b/config/homework_correction_cfg.json
@ -7,6 +7,6 @@
        "thinking": "disabled"
    },
    "tools": [],
-    "sp": "# 角色定义\n你是一位专业的初中数学作业批改助手，具有丰富的数学教学经验和精准的视觉识别能力。你能够准确识别作业图片中的题目内容、学生答案，并判断答案的正确性。\n\n# 任务目标\n分析上传的初中数学作业图片，识别每道题目及其学生答案，判断答案是否正确，并输出结构化的批改结果JSON。\n\n# 工作流上下文\n- **Input**：作业图片（图片URL）\n- **Process**：\n  1. 仔细识别图片中的所有题目，包括题号、题目内容\n  2. 识别每道题的学生答案，注意区分小题（如(1)(2)(3)）\n  3. 判断每个答案的正确性，对于解答题需要检查计算过程和结果\n  4. 为每个批改标记确定在原图上的相对坐标位置（批改标记应放置在答案末尾右侧）\n  5. 输出结构化的JSON结果\n- **Output**：包含所有批改结果的JSON对象\n\n# 约束与规则\n- 严格按照要求的JSON格式输出，不要添加任何额外文本\n- 坐标使用相对值（0-1000），(0,0)为图片左上角\n- 批改标记位置应在答案末尾的右侧，留出适当间距\n- 对于解答题，如果过程正确但结果有误，标记为错误\n- 如果答案部分正确，酌情判断\n- 图片宽高信息需要从图片本身获取\n- **重要**: explanation字段只能使用纯文本，禁止使用LaTeX公式或特殊符号\n\n# 过程\n1. 识别题目结构：扫描图片，定位所有题目，记录题号和小题号\n2. 答案识别：逐题识别学生的作答内容\n3. 正确性判断：\n   - 对于计算题：检查计算过程和结果\n   - 对于证明题：检查证明逻辑是否完整\n   - 对于作图题：检查图形是否正确\n4. 坐标定位：确定每道题答案末尾的坐标位置\n5. 生成JSON：按要求格式输出结果\n\n# 输出格式\n仅返回如下格式的JSON对象（不要包含```json标记）：\n{\n  \"corrections\": [\n    {\n      \"question_number\": \"题号（如10）\",\n      \"sub_question\": \"小题号（如(1)），无小题为空字符串\",\n      \"is_correct\": true或false,\n      \"bbox\": {\n        \"topLeftX\": 左上角X坐标（相对值0-1000）,\n        \"topLeftY\": 左上角Y坐标（相对值0-1000）,\n        \"bottomRightX\": 右下角X坐标（相对值0-1000）,\n        \"bottomRightY\": 右下角Y坐标（相对值0-1000）\n      },\n      \"explanation\": \"简要批改说明（纯文本，禁止使用LaTeX）\"\n    }\n  ],\n  \"image_width\": 图片宽度（像素），\n  \"image_height\": 图片高度（像素）\n}",
-    "up": "请批改这张初中数学作业图片，识别所有题目和学生答案，判断正误并输出批改结果JSON。注意：explanation字段只能使用纯文本，禁止使用LaTeX公式。图片URL：{{image_url}}"
+    "sp": "# 角色定义\n你是一位专业的初中物理作业批改助手，具有丰富的物理教学经验和精准的视觉识别能力。你能够准确识别作业图片中的题目内容、学生答案，并判断答案的正确性。\n\n# 任务目标\n分析上传的初中物理作业图片，识别每道题目及其学生答案，判断答案是否正确，并输出结构化的批改结果JSON。\n\n# 工作流上下文\n- **Input**：作业图片（图片URL）\n- **Process**：\n  1. 仔细识别图片中的所有题目，包括题号、题目内容\n  2. 识别每道题的学生答案，注意区分小题（如(1)(2)(3)）\n  3. 判断每个答案的正确性，对于解答题需要检查计算过程和结果\n  4. 为每个批改标记确定在原图上的相对坐标位置（批改标记应放置在答案末尾右侧）\n  5. 输出结构化的JSON结果\n- **Output**：包含所有批改结果的JSON对象\n\n# 约束与规则\n- 严格按照要求的JSON格式输出，不要添加任何额外文本\n- 坐标使用相对值（0-1000），(0,0)为图片左上角\n- 批改标记位置应在答案末尾的右侧，留出适当间距\n- 对于解答题，如果过程正确但结果有误，标记为错误\n- 如果答案部分正确，酌情判断\n- 图片宽高信息需要从图片本身获取\n- **重要**: explanation字段只能使用纯文本，禁止使用LaTeX公式或特殊符号\n\n# 过程\n1. 识别题目结构：扫描图片，定位所有题目，记录题号和小题号\n2. 答案识别：逐题识别学生的作答内容\n3. 正确性判断：\n   - 对于计算题：检查计算过程和结果\n   - 对于证明题：检查证明逻辑是否完整\n   - 对于作图题：检查图形是否正确\n4. 坐标定位：确定每道题答案末尾的坐标位置\n5. 生成JSON：按要求格式输出结果\n\n# 输出格式\n仅返回如下格式的JSON对象（不要包含```json标记）：\n{\n  \"corrections\": [\n    {\n      \"question_number\": \"题号（如10）\",\n      \"sub_question\": \"小题号（如(1)），无小题为空字符串\",\n      \"is_correct\": true或false,\n      \"bbox\": {\n        \"topLeftX\": 左上角X坐标（相对值0-1000）,\n        \"topLeftY\": 左上角Y坐标（相对值0-1000）,\n        \"bottomRightX\": 右下角X坐标（相对值0-1000）,\n        \"bottomRightY\": 右下角Y坐标（相对值0-1000）\n      },\n      \"explanation\": \"简要批改说明（纯文本，禁止使用LaTeX）\"\n    }\n  ],\n  \"image_width\": 图片宽度（像素），\n  \"image_height\": 图片高度（像素）\n}",
+    "up": "请批改这张初中物理作业图片，识别所有题目和学生答案，判断正误并输出批改结果JSON。注意：explanation字段只能使用纯文本，禁止使用LaTeX公式。图片URL：{{image_url}}"
 }
--- a/config/homework_recognize_llm_cfg.json
+++ b/config/homework_recognize_llm_cfg.json
@ -7,6 +7,6 @@
        "thinking": "disabled"
    },
    "tools": [],
-    "sp": "# 角色\n你是数学作业批改助手。\n\n# 禁止标注\n- 印刷体文字、题干\n\n# 需要标注\n- 学生手写答案（仅答案区域）\n\n# 坐标系统（关键）\n- 使用相对坐标（0-1000），图片左上角为(0,0)，右下角为(1000,1000)\n- answer_bbox: [x1, y1, x2, y2] 表示答案区域的边界框\n- x1,y1是左上角，x2,y2是右下角\n- **坐标必须精确框选学生手写答案区域**，不要包含题干\n- 答案框应紧贴手写内容，留5-10像素边距\n\n# 填空题处理（重要）\n- 一道题有多个填空时，**每个空单独识别为一个题目**\n- 题号格式：\"3(1)第一空\"、\"3(1)第二空\"或\"3.1\"、\"3.2\"\n- 每个空的坐标独立标注，只框选该空的答案\n\n# 空答案处理（必须遵守）\n- 如果学生没有作答（空白、只有涂改痕迹），必须判定为**incorrect**\n- status字段填写\"incorrect\"\n- score字段填写0\n- comment字段填写\"未作答\"\n\n# 批改准确性（核心）\n- **有标准答案时**：严格对照标准答案批改\n  - 选择题：答案必须是单个字母（A/B/C/D）\n  - 填空题：数值、单位、表达式必须完全匹配\n  - 计算题：结果和单位都要正确\n- **无标准答案时**：根据数学知识判断\n  - 解题思路是否正确\n  - 计算过程是否合理\n  - 结果是否正确\n\n# comment规范\n- **正确时**：简短说明原因（如\"解题步骤正确\"）\n- **错误时**：指出错误并给出正确答案（如\"应为12，注意计算过程\"）\n- **空答案**：填写\"未作答\"\n- **字数限制**：不超过{{comment_max_length}}字\n- **禁止**：不要输出思考过程、不要输出详细解析\n\n# 输出格式\n{\"results\": [{\"question_id\": \"题号\", \"student_answer\": \"学生答案\", \"answer_bbox\": [x1, y1, x2, y2], \"status\": \"correct或incorrect\", \"score\": 得分, \"full_score\": 满分, \"comment\": \"精练评语\"}]}\n\n# comment示例\n- 正确：\"解题步骤正确，答案准确\"\n- 错误：\"应为12，3×4=12\"\n- 空答案：\"未作答\"",
-    "up": "批改数学作业。**精确标注手写答案坐标**。**每个填空单独识别**。**comment写精练评语**。输出完整JSON。图片：{{image_url}}"
+    "sp": "# 角色\n你是物理作业批改助手。\n\n# 禁止标注\n- 印刷体文字、实验装置图、图中字母、题干\n\n# 需要标注\n- 学生手写答案（仅答案区域）\n\n# 坐标系统（关键）\n- 使用相对坐标（0-1000），图片左上角为(0,0)，右下角为(1000,1000)\n- answer_bbox: [x1, y1, x2, y2] 表示答案区域的边界框\n- x1,y1是左上角，x2,y2是右下角\n- **坐标必须精确框选学生手写答案区域**，不要包含题干\n- 答案框应紧贴手写内容，留5-10像素边距\n\n# 填空题处理（重要）\n- 一道题有多个填空时，**每个空单独识别为一个题目**\n- 题号格式：\"3(1)第一空\"、\"3(1)第二空\"或\"3.1\"、\"3.2\"\n- 每个空的坐标独立标注，只框选该空的答案\n\n# 空答案处理（必须遵守）\n- 如果学生没有作答（空白、只有涂改痕迹），必须判定为**incorrect**\n- status字段填写\"incorrect\"\n- score字段填写0\n- comment字段填写\"未作答\"\n\n# 批改准确性（核心）\n- **有标准答案时**：严格对照标准答案批改\n  - 选择题：答案必须是单个字母（A/B/C/D）\n  - 填空题：数值、单位、表达式必须完全匹配\n  - 计算题：结果和单位都要正确\n- **无标准答案时**：根据物理知识判断\n  - 公式应用是否正确\n  - 计算过程是否合理\n  - 单位是否正确\n\n# comment规范\n- **正确时**：简短说明原因（如\"浮力公式应用正确\"）\n- **错误时**：指出错误并给出正确答案（如\"应为1.2N，注意单位换算\"）\n- **空答案**：填写\"未作答\"\n- **字数限制**：不超过{{comment_max_length}}字\n- **禁止**：不要输出思考过程、不要输出详细解析\n\n# 输出格式\n{\"results\": [{\"question_id\": \"题号\", \"student_answer\": \"学生答案\", \"answer_bbox\": [x1, y1, x2, y2], \"status\": \"correct或incorrect\", \"score\": 得分, \"full_score\": 满分, \"comment\": \"精练评语\"}]}\n\n# comment示例\n- 正确：\"浮力公式F浮=ρ液gV排应用正确\"\n- 错误：\"应为1.2N，F浮=ρ液gV排=1.0×10³×10×1.2×10⁻⁴=1.2N\"\n- 空答案：\"未作答\"",
+    "up": "批改物理作业。**精确标注手写答案坐标**。**每个填空单独识别**。**comment写精练评语**。输出完整JSON。图片：{{image_url}}"
 }
--- a/config/question_locate_llm_cfg.json
+++ b/config/question_locate_llm_cfg.json
@ -12,6 +12,6 @@
        "model": "doubao-seed-2-0-pro-260215"
    },
    "tools": [],
-    "sp": "你是一位专业的初中数学作业识别专家，擅长从作业图片中定位题目位置和提取答案区域。",
+    "sp": "你是一位专业的初中物理作业识别专家，擅长从作业图片中定位题目位置和提取答案区域。",
    "up": "请识别这张作业图片中的所有题目位置，返回准确的边界框坐标。"
 }
--- a/src/graphs/graph.py
+++ b/src/graphs/graph.py
@ -1,4 +1,4 @@
-"""初中数学作业批改工作流主图编排 - 支持多图片批改"""
+"""初中物理作业批改工作流主图编排 - 支持多图片批改"""
 from langgraph.graph import StateGraph, END
 from langchain_core.runnables import RunnableConfig
 from langgraph.runtime import Runtime
--- a/src/graphs/nodes/doc_extract_node.py
+++ b/src/graphs/nodes/doc_extract_node.py
@ -10,7 +10,7 @@ from typing import List
 from langchain_core.runnables import RunnableConfig
 from langgraph.runtime import Runtime
 from coze_coding_utils.runtime_ctx.context import Context
-from coze_coding_dev_sdk import LLMClient
+from utils.llm_client import LLMClient  # 使用自定义LLM客户端
 from langchain_core.messages import HumanMessage
 from docx import Document

@ -213,7 +213,7 @@ def parse_answer_doc_with_llm(answer_doc_url: str, ctx, config: RunnableConfig)
    
    llm_config = _cfg.get("config", {})
    
-    user_prompt = f"""你是一位资深的初中数学教师，请从以下试卷答案Word文档内容中提取所有题目的标准答案。
+    user_prompt = f"""你是一位资深的初中物理教师，请从以下试卷答案Word文档内容中提取所有题目的标准答案。

 【Word文档内容】
 {doc_text[:20000]}
--- a/src/graphs/nodes/image_preprocess_node.py
+++ b/src/graphs/nodes/image_preprocess_node.py
@ -24,23 +24,6 @@ DEFAULT_IMAGE_SIZE = (1000, 1400)
 IMAGE_DOWNLOAD_TIMEOUT = 30  # 单次下载超时
 MAX_RETRIES = 2  # 最大重试次数（减少重试）

-# HTTP Headers（支持阿里云 CDN 等）
-DOWNLOAD_HEADERS = {
-    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3',
-    'Accept': 'image/webp,image/apng,image/*,*/*;q=0.8',
-    'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8',
-}
-
-
-class HTTPRedirectHandler(urllib.request.HTTPRedirectHandler):
-    """自定义重定向处理器，保留 headers"""
-    def http_error_302(self, req, fp, code, msg, headers):
-        # 重定向时保留 headers
-        return super().http_error_302(req, fp, code, headers)
-    
-    def http_error_301(self, req, fp, code, msg, headers):
-        return super().http_error_301(req, fp, code, headers)
-

 def get_image_info_with_retry(image_url: str, max_retries: int = MAX_RETRIES, timeout: int = IMAGE_DOWNLOAD_TIMEOUT) -> Tuple[int, int, int]:
    """
@ -65,15 +48,8 @@ def get_image_info_with_retry(image_url: str, max_retries: int = MAX_RETRIES, ti
            break
            
        try:
-            # 创建带有 headers 的请求
-            req = urllib.request.Request(image_url, headers=DOWNLOAD_HEADERS)
-            
-            # 创建 opener（支持重定向并保留 headers）
-            opener = urllib.request.build_opener(HTTPRedirectHandler)
-            urllib.request.install_opener(opener)
-            
            # 下载图片（带超时）
-            with urllib.request.urlopen(req, timeout=timeout) as response:
+            with urllib.request.urlopen(image_url, timeout=timeout) as response:
                img_data = response.read()
            
            # 检查数据大小
--- a/src/graphs/nodes/recognize_and_correct_node.py
+++ b/src/graphs/nodes/recognize_and_correct_node.py
@ -9,7 +9,7 @@ from jinja2 import Template
 from langchain_core.runnables import RunnableConfig
 from langgraph.runtime import Runtime
 from coze_coding_utils.runtime_ctx.context import Context
-from coze_coding_dev_sdk import LLMClient
+from utils.llm_client import LLMClient  # 使用自定义LLM客户端
 from langchain_core.messages import HumanMessage

 from graphs.state import (
@ -184,7 +184,7 @@ def build_dynamic_prompt(
 【标准答案】
 {answers_text}"""
    else:
-        answer_hint = "\n【批改模式】无标准答案，请根据数学知识判断。"
+        answer_hint = "\n【批改模式】无标准答案，请根据物理知识判断。"
    
    return f"""
 【图片尺寸】{image_width}×{image_height}像素
@ -206,23 +206,6 @@ def recognize_and_correct_node(
    """
    ctx = runtime.context
    
-    # 获取参数并验证图片 URL
-    image_url = state.image_url
-    if not image_url or not isinstance(image_url, str):
-        logger.error(f"Invalid image URL: {image_url}")
-        return RecognizeAndCorrectOutput(
-            question_items=[],
-            correction_results=[]
-        )
-    
-    # 验证 URL 格式（必须是 http:// 或 https://）
-    if not image_url.startswith(('http://', 'https://')):
-        logger.error(f"Invalid image URL format: {image_url}")
-        return RecognizeAndCorrectOutput(
-            question_items=[],
-            correction_results=[]
-        )
-    
    # 读取LLM配置
    cfg_file = os.path.join(os.getenv("COZE_WORKSPACE_PATH", ""), config["metadata"]["llm_cfg"])
    with open(cfg_file, "r", encoding="utf-8") as fd:
@ -232,7 +215,8 @@ def recognize_and_correct_node(
    sp = _cfg.get("sp", "")
    up = _cfg.get("up", "")
    
-    # 获取其他参数
+    # 获取参数
+    image_url = state.image_url
    image_info = state.image_info
    correct_answers = state.correct_answers
    comment_max_length = getattr(state, 'comment_max_length', 100)
--- a/src/graphs/state.py
+++ b/src/graphs/state.py
@ -1,4 +1,4 @@
-"""初中数学作业批改工作流状态定义 - 支持多学生多图片批改"""
+"""初中物理作业批改工作流状态定义 - 支持多学生多图片批改"""
 from typing import List, Optional, Literal
 from pydantic import BaseModel, Field
 from utils.file.file import File
--- a/src/storage/s3/init.py
+++ b/src/storage/s3/init.py
--- a/src/storage/s3/s3_storage.py
+++ b/src/storage/s3/s3_storage.py
@ -0,0 +1,424 @@
+import os
+import re
+from pathlib import Path
+from typing import Optional, Any, Dict, List, TypedDict, Iterable
+from uuid import uuid4
+
+import boto3
+from botocore.exceptions import ClientError
+from boto3.s3.transfer import TransferConfig
+import logging
+logger = logging.getLogger(__name__)
+
+# 允许的文件名字符集（面向用户输入的约束）
+FILE_NAME_ALLOWED_RE = re.compile(r"^[A-Za-z0-9._\-/]+$")
+
+
+class ListFilesResult(TypedDict):
+    # list_files 的返回结构类型
+    keys: List[str]
+    is_truncated: bool
+    next_continuation_token: Optional[str]
+
+class S3SyncStorage:
+    """S3兼容存储实现"""
+
+    def __init__(self, *, endpoint_url: Optional[str] = None, access_key: str, secret_key: str, bucket_name: str, region: str = "cn-beijing"):
+        self.endpoint_url = os.environ.get("COZE_BUCKET_ENDPOINT_URL") or endpoint_url or ''
+        self.access_key = access_key
+        self.secret_key = secret_key
+        self.bucket_name = bucket_name
+        self.region = region
+        self._client = None
+
+    def _get_client(self):
+        if self._client is None:
+            endpoint = self.endpoint_url
+            if endpoint is None or endpoint == "":
+                try:
+                    from coze_workload_identity import Client as CozeEnvClient
+                    coze_env_client = CozeEnvClient()
+                    env_vars = coze_env_client.get_project_env_vars()
+                    coze_env_client.close()
+                    for env_var in env_vars:
+                        if env_var.key == "COZE_BUCKET_ENDPOINT_URL":
+                            endpoint = env_var.value.replace("'", "'\\''")
+                            self.endpoint_url = endpoint
+                            break
+                except Exception as e:
+                    logger.error(f"Error loading COZE_BUCKET_ENDPOINT_URL: {e}")
+                    # 保持向下校验逻辑，避免在此处中断
+            if endpoint is None or endpoint == "":
+                logger.error("未配置存储端点：请设置endpoint_url")
+                raise ValueError("未配置存储端点：请设置endpoint_url")
+
+            client = boto3.client(
+                "s3",
+                endpoint_url=endpoint,
+                aws_access_key_id=self.access_key,
+                aws_secret_access_key=self.secret_key,
+                region_name=self.region,
+            )
+
+            # 注册 before-call 钩子，发送前注入 x-storage-token 头
+            def _inject_header(**kwargs):
+                try:
+                    from coze_workload_identity import Client as CozeClient
+                    coze_client = CozeClient()
+                    try:
+                        token = coze_client.get_access_token()
+                    except Exception as e:
+                        logger.error("Error loading COZE_WORKLOAD_IDENTITY_TOKEN: %s", e)
+                        token = None
+                        raise e
+                    finally:
+                        coze_client.close()
+                    params = kwargs.get("params", {})
+                    headers = params.setdefault("headers", {})
+                    headers["x-storage-token"] = token
+                except Exception as e:
+                    logger.error("Error loading COZE_WORKLOAD_IDENTITY_TOKEN: %s", e)
+                    pass
+            client.meta.events.register("before-call.s3", _inject_header)
+            self._client = client
+        return self._client
+
+    def _generate_object_key(self, *, original_name: str) -> str:
+        suffix = Path(original_name).suffix.lower()
+        stem = Path(original_name).stem
+        uniq = uuid4().hex[:8]
+        return f"{stem}_{uniq}{suffix}"
+
+    def _extract_logid(self, e: Exception) -> Optional[str]:
+        """从 ClientError 中提取 x-tt-logid"""
+        if isinstance(e, ClientError):
+            headers = (e.response or {}).get("ResponseMetadata", {}).get("HTTPHeaders", {})
+            return headers.get("x-tt-logid")
+        return None
+
+    def _error_msg(self, msg: str, e: Exception) -> str:
+        """构建带 logid 的错误信息"""
+        logid = self._extract_logid(e)
+        if logid:
+            return f"{msg}: {e} (x-tt-logid: {logid})"
+        return f"{msg}: {e}"
+
+    def _resolve_bucket(self, bucket: Optional[str]) -> str:
+        """统一解析 bucket 来源，确保得到有效桶名。"""
+        target_bucket = bucket or os.environ.get("COZE_BUCKET_NAME") or self.bucket_name
+        if not target_bucket:
+            raise ValueError("未配置 bucket：请传入 bucket 或设置 COZE_BUCKET_NAME，或在实例化时提供 bucket_name")
+        return target_bucket
+
+    def _validate_file_name(self, name: str) -> None:
+        """校验 S3 对象命名：长度≤1024；允许 [A-Za-z0-9._-/]；不以 / 起止且不含 //。"""
+        msg = (
+            "file name invalid: 文件名需满足以下 S3 对象命名规范："
+            "1) 长度 1–1024 字节；"
+            "2) 仅允许字母、数字、点(.)、下划线(_)、短横(-)、目录分隔符(/)；"
+            "3) 不允许空格或以下特殊字符：? # & % { } ^ [ ] ` \\ < > ~ | \" ' + = : ;；"
+            "4) 不以 / 开头或结尾，且不包含连续的 //；"
+            "示例：report_2025-12-11.pdf、images/photo-01.png。"
+        )
+
+        if not name or not name.strip():
+            raise ValueError(msg + "（原因：文件名为空）")
+
+        # S3 限制对象 key 最大 1024 字节，这里沿用到输入文件名
+        if len(name.encode("utf-8")) > 1024:
+            raise ValueError(msg + "（原因：长度超过 1024 字节）")
+
+        if name.startswith("/") or name.endswith("/"):
+            raise ValueError(msg + "（原因：以 / 开头或结尾）")
+        if "//" in name:
+            raise ValueError(msg + "（原因：包含连续的 //）")
+
+        # 允许字符集校验
+        if not FILE_NAME_ALLOWED_RE.match(name):
+            bad = re.findall(r"[^A-Za-z0-9._\-/]", name)
+            example = bad[0] if bad else "非法字符"
+            raise ValueError(msg + f"（原因：包含非法字符，例如：{example}）")
+
+    def upload_file(self, *, file_content: bytes, file_name: str, content_type: str = "application/octet-stream", bucket: Optional[str] = None) -> str:
+        # 先对输入文件名做规范校验，避免生成无效对象 key
+        self._validate_file_name(file_name)
+        try:
+            client = self._get_client()
+            object_key = self._generate_object_key(original_name=file_name)
+            target_bucket = self._resolve_bucket(bucket)
+            client.put_object(Bucket=target_bucket, Key=object_key, Body=file_content, ContentType=content_type)
+            return object_key
+        except Exception as e:
+            logger.error(self._error_msg("Error uploading file to S3", e))
+            raise e
+
+    def delete_file(self, *, file_key: str, bucket: Optional[str] = None) -> bool:
+        try:
+            client = self._get_client()
+            target_bucket = self._resolve_bucket(bucket)
+            client.delete_object(Bucket=target_bucket, Key=file_key)
+            return True
+        except Exception as e:
+            logger.error(self._error_msg("Error deleting file from S3", e))
+            raise e
+
+    def file_exists(self, *, file_key: str, bucket: Optional[str] = None) -> bool:
+        try:
+            client = self._get_client()
+            target_bucket = self._resolve_bucket(bucket)
+            client.head_object(Bucket=target_bucket, Key=file_key)
+            return True
+        except ClientError as e:
+            code = (e.response or {}).get("Error", {}).get("Code", "")
+            if code in {"404", "NoSuchKey", "NotFound"}:
+                return False
+            logger.error(self._error_msg("Error checking file existence in S3", e))
+            return False
+        except Exception as e:
+            logger.error(self._error_msg("Error checking file existence in S3", e))
+            return False
+
+    def read_file(self, *, file_key: str, bucket: Optional[str] = None) -> bytes:
+        try:
+            client = self._get_client()
+            target_bucket = self._resolve_bucket(bucket)
+            resp = client.get_object(Bucket=target_bucket, Key=file_key)
+            body = resp.get("Body")
+            if body is None:
+                raise RuntimeError("S3 get_object returned no Body")
+            try:
+                return body.read()
+            finally:
+                try:
+                    body.close()
+                except Exception as ce:
+                    # 资源关闭失败不影响读取结果，仅记录以便排查
+                    logger.debug("Failed to close S3 response body: %s", ce)
+        except Exception as e:
+            logger.error(self._error_msg("Error reading file from S3", e))
+            raise e
+
+    def list_files(self, *, prefix: Optional[str] = None, bucket: Optional[str] = None, max_keys: int = 1000, continuation_token: Optional[str] = None) -> ListFilesResult:
+        """列出对象，支持前缀过滤与分页；返回 keys/is_truncated/next_continuation_token。"""
+        try:
+            client = self._get_client()
+            target_bucket = self._resolve_bucket(bucket)
+            if max_keys <= 0 or max_keys > 1000:
+                raise ValueError("max_keys 必须在 1 到 1000 之间")
+
+            kwargs: Dict[str, Any] = {
+                "Bucket": target_bucket,
+                "MaxKeys": max_keys,
+                "Prefix": prefix,
+                "ContinuationToken": continuation_token,
+            }
+            kwargs = {k: v for k, v in kwargs.items() if v is not None}
+
+            resp = client.list_objects_v2(**kwargs)
+            contents = resp.get("Contents", []) or []
+            keys: List[str] = [item.get("Key") for item in contents if isinstance(item, dict) and item.get("Key")]
+            return {
+                "keys": keys,
+                "is_truncated": bool(resp.get("IsTruncated")),
+                "next_continuation_token": resp.get("NextContinuationToken"),
+            }
+        except ClientError as e:
+            code = (e.response or {}).get("Error", {}).get("Code", "")
+            logger.error(self._error_msg(f"Error listing files in S3 (code={code})", e))
+            raise e
+        except Exception as e:
+            logger.error(self._error_msg("Error listing files in S3", e))
+            raise e
+
+    def generate_presigned_url(self, *, key: str, bucket: Optional[str] = None, expire_time: int = 1800) -> str:
+        """通过 S3 Proxy 生成签名 URL。"""
+        import json
+        import urllib.request as urllib_request
+        try:
+            from coze_workload_identity import Client as CozeClient
+            coze_client = CozeClient()
+            try:
+                token = coze_client.get_access_token()
+            finally:
+                try:
+                    coze_client.close()
+                except Exception:
+                    # 资源释放失败不影响后续流程
+                    pass
+        except Exception as e:
+            logger.error(f"Error loading x-storage-token: {e}")
+            raise RuntimeError(f"获取 x-storage-token 失败: {e}")
+        try:
+            sign_base = os.environ.get("COZE_BUCKET_ENDPOINT_URL") or self.endpoint_url
+            if not sign_base:
+                raise ValueError("未配置签名端点：请设置 COZE_BUCKET_ENDPOINT_URL 或传入 endpoint_url")
+            sign_url_endpoint = sign_base.rstrip("/") + "/sign-url"
+
+            headers = {
+                "Content-Type": "application/json",
+                "x-storage-token": token,
+            }
+
+            target_bucket = self._resolve_bucket(bucket)
+            payload = {"bucket_name": target_bucket, "path": key, "expire_time": expire_time}
+            data = json.dumps(payload).encode("utf-8")
+            request = urllib_request.Request(sign_url_endpoint, data=data, headers=headers, method="POST")
+        except Exception as e:
+            logger.error(f"Error creating request for sign-url: {e}")
+            raise RuntimeError(f"创建 sign-url 请求失败: {e}")
+
+        try:
+            with urllib_request.urlopen(request) as resp:
+                resp_bytes = resp.read()
+                content_type = resp.headers.get("Content-Type", "")
+                text = resp_bytes.decode("utf-8", errors="replace")
+                if "application/json" in content_type or text.strip().startswith("{"):
+                    try:
+                        obj = json.loads(text)
+                    except Exception:
+                        return text
+                    data = obj.get("data")
+                    if isinstance(data, dict) and "url" in data:
+                        return data["url"]
+                    url_value = obj.get("url") or obj.get("signed_url") or obj.get("presigned_url")
+                    if url_value:
+                        return url_value
+                    raise ValueError("签名服务返回缺少 data.url/url 字段")
+                return text
+        except Exception as e:
+            raise RuntimeError(f"生成签名URL失败: {e}")
+
+    def stream_upload_file(
+            self,
+            *,
+            fileobj,
+            file_name: str,
+            content_type: str = "application/octet-stream",
+            bucket: Optional[str] = None,
+            multipart_chunksize: int = 5 * 1024 * 1024,
+            multipart_threshold: int = 5 * 1024 * 1024,
+            max_concurrency: int = 1,
+            use_threads: bool = False,
+    ) -> str:
+        """流式上传（文件对象）
+        - fileobj: 任何带有 read() 方法的文件对象（如 open(..., 'rb') 返回的对象、io.BytesIO 等）
+        - file_name: 原始文件名，用于生成唯一 key
+        - content_type: MIME 类型
+        - bucket: 目标桶；为空时取环境变量或实例默认值
+        - multipart_chunksize: 分片大小（默认 5MB，以适配代理层限制）
+        - multipart_threshold: 触发分片上传的阈值（默认 5MB）
+        - max_concurrency: 并发分片上传的并发数（默认 1，避免代理层节流影响）
+        - use_threads: 是否启用线程并发（默认 False）
+        返回：最终写入的对象 key
+        """
+        try:
+            client = self._get_client()
+            target_bucket = self._resolve_bucket(bucket)
+            key = self._generate_object_key(original_name=file_name)
+
+            extra_args = {"ContentType": content_type} if content_type else {}
+            # 使用 boto3 的高阶方法执行多段上传（传入 TransferConfig 控制分片大小）
+
+            config = TransferConfig(
+                multipart_chunksize=multipart_chunksize,
+                multipart_threshold=multipart_threshold,
+                max_concurrency=max_concurrency,
+                use_threads=use_threads,
+            )
+            client.upload_fileobj(Fileobj=fileobj, Bucket=target_bucket, Key=key, ExtraArgs=extra_args, Config=config)
+            return key
+        except Exception as e:
+            logger.error(self._error_msg("Error streaming upload (fileobj) to S3", e))
+            raise e
+
+    def upload_from_url(
+            self,
+            *,
+            url: str,
+            bucket: Optional[str] = None,
+            timeout: int = 30,
+    ) -> str:
+        """从 URL 流式下载并上传到 S3
+        - url: 源文件 URL
+        - bucket: 目标桶；为空时取环境变量或实例默认值
+        - timeout: HTTP 请求超时时间（秒，默认 30）
+        返回：最终写入的对象 key
+        """
+        import urllib.request as urllib_request
+        from urllib.parse import urlparse, unquote
+        try:
+            request = urllib_request.Request(url)
+            with urllib_request.urlopen(request, timeout=timeout) as resp:
+                parsed = urlparse(url)
+                file_name = Path(unquote(parsed.path)).name or "file"
+                content_type = resp.headers.get("Content-Type", "application/octet-stream")
+                return self.stream_upload_file(
+                    fileobj=resp,
+                    file_name=file_name,
+                    content_type=content_type,
+                    bucket=bucket,
+                )
+        except Exception as e:
+            logger.error(self._error_msg("Error uploading from URL to S3", e))
+            raise e
+
+    def trunk_upload_file(self, *, chunk_iter: Iterable[bytes], file_name: str,
+                           content_type: str = "application/octet-stream", bucket: Optional[str] = None,
+                           part_size: int = 5 * 1024 * 1024) -> str:
+        """流式上传（字节迭代器，显式分片 Multipart Upload）
+        - chunk_iter: 可迭代对象，逐块产生 bytes；每块大小可变（内部累积到 part_size 再上传），最后一块可小于 5MB
+        - file_name: 原始文件名，用于生成唯一 key
+        - content_type: MIME 类型
+        - bucket: 目标桶；为空时取环境或实例默认值
+        - part_size: 每个 part 的最小大小（除最后一个）；默认 5MB
+        返回：最终写入的对象 key
+        """
+        client = self._get_client()
+        target_bucket = self._resolve_bucket(bucket)
+        key = self._generate_object_key(original_name=file_name)
+
+        # 初始化分片上传
+        try:
+            init_resp = client.create_multipart_upload(Bucket=target_bucket, Key=key, ContentType=content_type)
+            upload_id = init_resp["UploadId"]
+        except Exception as e:
+            logger.error(self._error_msg("create_multipart_upload failed", e))
+            raise e
+
+        parts = []
+        part_number = 1
+        buffer = bytearray()
+        try:
+            for chunk in chunk_iter:
+                if not chunk:
+                    continue
+                buffer.extend(chunk)
+                while len(buffer) >= part_size:
+                    data = bytes(buffer[:part_size])
+                    buffer = buffer[part_size:]
+                    resp = client.upload_part(Bucket=target_bucket, Key=key, UploadId=upload_id, PartNumber=part_number,
+                                              Body=data)
+                    parts.append({"PartNumber": part_number, "ETag": resp["ETag"]})
+                    part_number += 1
+
+            # 上传最后不足 part_size 的余量
+            if len(buffer) > 0:
+                resp = client.upload_part(Bucket=target_bucket, Key=key, UploadId=upload_id, PartNumber=part_number,
+                                          Body=bytes(buffer))
+                parts.append({"PartNumber": part_number, "ETag": resp["ETag"]})
+
+            # 完成分片
+            client.complete_multipart_upload(
+                Bucket=target_bucket,
+                Key=key,
+                UploadId=upload_id,
+                MultipartUpload={"Parts": parts},
+            )
+            return key
+        except Exception as e:
+            logger.error(self._error_msg("multipart upload failed", e))
+            try:
+                client.abort_multipart_upload(Bucket=target_bucket, Key=key, UploadId=upload_id)
+            except Exception as ae:
+                logger.error(self._error_msg("abort_multipart_upload failed", ae))
+            raise e
--- a/src/utils/cache_manager.py
+++ b/src/utils/cache_manager.py
@ -272,9 +272,8 @@ def cached(cache_manager: CacheManager):


 # 创建全局缓存实例
-# 注意：缓存目录使用学科前缀，避免学科冲突
 answer_doc_cache = CacheManager(
-    cache_name="math_answer_doc",  # 使用数学专用缓存目录
+    cache_name="answer_doc",
    maxsize=MAX_MEMORY_CACHE_SIZE,
    expire_days=CACHE_EXPIRE_DAYS
 )
--- a/src/utils/llm_client.py
+++ b/src/utils/llm_client.py
@ -0,0 +1,135 @@
+"""LLM客户端封装 - 兼容OpenAI API"""
+import os
+import logging
+from typing import List, Dict, Any, Optional, Union
+from openai import OpenAI
+
+logger = logging.getLogger(__name__)
+
+
+class LLMClient:
+    """
+    LLM客户端封装类，兼容OpenAI API格式
+    
+    支持的提供商：
+    - 火山引擎豆包大模型
+    - OpenAI
+    - 其他兼容OpenAI格式的API
+    """
+    
+    def __init__(self, ctx=None):
+        """
+        初始化LLM客户端
+        
+        Args:
+            ctx: 上下文对象（兼容原SDK接口，实际不使用）
+        """
+        self.api_key = os.getenv("LLM_API_KEY")
+        self.base_url = os.getenv("LLM_BASE_URL")
+        self.model_name = os.getenv("LLM_MODEL_NAME", "doubao-seed-2-0-pro-260215")
+        
+        if not self.api_key:
+            raise ValueError("LLM_API_KEY environment variable is not set")
+        
+        self.client = OpenAI(
+            api_key=self.api_key,
+            base_url=self.base_url
+        )
+        
+        logger.info(f"LLMClient initialized with base_url: {self.base_url}")
+    
+    def invoke(
+        self,
+        messages: List[Dict[str, Any]],
+        model: Optional[str] = None,
+        temperature: float = 0.0,
+        max_completion_tokens: int = 8192,
+        **kwargs
+    ) -> Any:
+        """
+        调用大模型API
+        
+        Args:
+            messages: 消息列表，支持文本和多模态内容
+            model: 模型名称（可选，默认使用环境变量）
+            temperature: 温度参数
+            max_completion_tokens: 最大生成token数
+            **kwargs: 其他参数
+            
+        Returns:
+            响应对象，包含 content 属性
+        """
+        model = model or self.model_name
+        
+        logger.info(f"Invoking LLM with model: {model}, temperature: {temperature}")
+        
+        try:
+            response = self.client.chat.completions.create(
+                model=model,
+                messages=messages,
+                temperature=temperature,
+                max_tokens=max_completion_tokens,
+                **kwargs
+            )
+            
+            # 返回兼容格式的响应对象
+            class Response:
+                def __init__(self, content):
+                    self.content = content
+            
+            # 提取响应内容
+            if response.choices and len(response.choices) > 0:
+                content = response.choices[0].message.content
+                return Response(content=content)
+            else:
+                logger.error("Empty response from LLM")
+                return Response(content="")
+                
+        except Exception as e:
+            logger.error(f"LLM invocation failed: {e}")
+            raise
+    
+    def stream(
+        self,
+        messages: List[Dict[str, Any]],
+        model: Optional[str] = None,
+        temperature: float = 0.0,
+        max_completion_tokens: int = 8192,
+        **kwargs
+    ):
+        """
+        流式调用大模型API
+        
+        Args:
+            messages: 消息列表
+            model: 模型名称
+            temperature: 温度参数
+            max_completion_tokens: 最大生成token数
+            **kwargs: 其他参数
+            
+        Yields:
+            响应块
+        """
+        model = model or self.model_name
+        
+        logger.info(f"Streaming LLM with model: {model}")
+        
+        try:
+            stream = self.client.chat.completions.create(
+                model=model,
+                messages=messages,
+                temperature=temperature,
+                max_tokens=max_completion_tokens,
+                stream=True,
+                **kwargs
+            )
+            
+            for chunk in stream:
+                if chunk.choices and len(chunk.choices) > 0:
+                    delta = chunk.choices[0].delta
+                    if hasattr(delta, 'content') and delta.content:
+                        yield delta.content
+                        
+        except Exception as e:
+            logger.error(f"LLM streaming failed: {e}")
+            raise
--- a/test_image_url.sh
+++ b/test_image_url.sh
@ -0,0 +1,97 @@
+#!/bin/bash
+
+# ============================================
+# 图片URL测试脚本
+# ============================================
+
+echo "======================================"
+echo "  图片URL测试"
+echo "======================================"
+echo ""
+
+if [ -z "$1" ]; then
+    echo "用法: bash test_image_url.sh <图片URL>"
+    echo ""
+    echo "示例:"
+    echo "  bash test_image_url.sh https://example.com/image.jpg"
+    exit 1
+fi
+
+IMAGE_URL="$1"
+
+echo "测试URL: $IMAGE_URL"
+echo ""
+
+# 检查URL格式
+if [[ ! "$IMAGE_URL" =~ ^https?:// ]]; then
+    echo "❌ 错误: URL格式不正确，必须以 http:// 或 https:// 开头"
+    exit 1
+fi
+
+echo "✅ URL格式正确"
+echo ""
+
+# 检查URL可访问性
+echo "检查URL可访问性..."
+
+HTTP_CODE=$(curl -s -o /dev/null -w "%{http_code}" -I "$IMAGE_URL")
+
+if [ "$HTTP_CODE" = "200" ]; then
+    echo "✅ URL可访问 (HTTP $HTTP_CODE)"
+elif [ "$HTTP_CODE" = "404" ]; then
+    echo "❌ URL不存在 (HTTP 404)"
+    echo ""
+    echo "可能的原因："
+    echo "  1. 图片已被删除"
+    echo "  2. URL已过期"
+    echo "  3. URL错误"
+    exit 1
+elif [ "$HTTP_CODE" = "403" ]; then
+    echo "❌ 无权限访问 (HTTP 403)"
+    echo ""
+    echo "可能的原因："
+    echo "  1. 需要认证"
+    echo "  2. IP被限制"
+    echo "  3. 需要特定Referer"
+    exit 1
+else
+    echo "⚠️  警告: HTTP状态码 $HTTP_CODE"
+fi
+
+echo ""
+
+# 检查Content-Type
+echo "检查图片类型..."
+CONTENT_TYPE=$(curl -s -I "$IMAGE_URL" | grep -i "Content-Type" | awk '{print $2}' | tr -d '\r')
+
+if [[ "$CONTENT_TYPE" =~ image/ ]]; then
+    echo "✅ 图片类型: $CONTENT_TYPE"
+else
+    echo "⚠️  警告: Content-Type 不是图片类型: $CONTENT_TYPE"
+fi
+
+echo ""
+
+# 检查文件大小
+echo "检查文件大小..."
+CONTENT_LENGTH=$(curl -s -I "$IMAGE_URL" | grep -i "Content-Length" | awk '{print $2}' | tr -d '\r')
+
+if [ -n "$CONTENT_LENGTH" ]; then
+    SIZE_KB=$((CONTENT_LENGTH / 1024))
+    echo "✅ 文件大小: ${SIZE_KB}KB"
+    
+    if [ $SIZE_KB -lt 10 ]; then
+        echo "⚠️  警告: 文件过小，可能不是有效图片"
+    elif [ $SIZE_KB -gt 10240 ]; then
+        echo "⚠️  警告: 文件过大（>10MB），可能影响处理速度"
+    fi
+else
+    echo "⚠️  警告: 无法获取文件大小"
+fi
+
+echo ""
+echo "======================================"
+echo "  ✅ 测试完成"
+echo "======================================"
+echo ""
+echo "该图片URL可以用于作业批改工作流"
--- a/test_llm_connection.sh
+++ b/test_llm_connection.sh
@ -0,0 +1,107 @@
+#!/bin/bash
+
+# ============================================
+# LLM连接测试脚本
+# ============================================
+
+echo "======================================"
+echo "  LLM 连接测试"
+echo "======================================"
+echo ""
+
+# 检查环境变量
+if [ -z "$LLM_API_KEY" ]; then
+    echo "❌ 错误: LLM_API_KEY 未设置"
+    echo ""
+    echo "请先设置环境变量："
+    echo "  export LLM_API_KEY='your-api-key'"
+    echo "  export LLM_BASE_URL='https://ark.cn-beijing.volces.com/api/v3'"
+    echo "  export LLM_MODEL_NAME='doubao-seed-2-0-pro-260215'"
+    exit 1
+fi
+
+if [ -z "$LLM_BASE_URL" ]; then
+    echo "⚠️  警告: LLM_BASE_URL 未设置，使用默认值"
+    export LLM_BASE_URL="https://ark.cn-beijing.volces.com/api/v3"
+fi
+
+if [ -z "$LLM_MODEL_NAME" ]; then
+    echo "⚠️  警告: LLM_MODEL_NAME 未设置，使用默认值"
+    export LLM_MODEL_NAME="doubao-seed-2-0-pro-260215"
+fi
+
+echo "✅ 环境变量已设置"
+echo "   - LLM_API_KEY: ${LLM_API_KEY:0:10}..."
+echo "   - LLM_BASE_URL: $LLM_BASE_URL"
+echo "   - LLM_MODEL_NAME: $LLM_MODEL_NAME"
+echo ""
+
+# 测试LLM连接
+echo "正在测试 LLM 连接..."
+echo ""
+
+python3 << 'EOF'
+import os
+import sys
+
+try:
+    from openai import OpenAI
+    
+    api_key = os.getenv("LLM_API_KEY")
+    base_url = os.getenv("LLM_BASE_URL")
+    model_name = os.getenv("LLM_MODEL_NAME")
+    
+    print(f"正在连接到: {base_url}")
+    print(f"使用模型: {model_name}")
+    print("")
+    
+    client = OpenAI(
+        api_key=api_key,
+        base_url=base_url
+    )
+    
+    print("发送测试请求...")
+    response = client.chat.completions.create(
+        model=model_name,
+        messages=[
+            {"role": "user", "content": "你好，请回复'测试成功'"}
+        ],
+        max_tokens=50
+    )
+    
+    if response.choices and len(response.choices) > 0:
+        content = response.choices[0].message.content
+        print("")
+        print("✅ LLM 连接成功！")
+        print(f"   响应: {content}")
+        print("")
+        sys.exit(0)
+    else:
+        print("❌ LLM 响应为空")
+        sys.exit(1)
+        
+except Exception as e:
+    print(f"❌ LLM 连接失败: {e}")
+    print("")
+    print("可能的原因：")
+    print("  1. API Key 无效")
+    print("  2. Base URL 错误")
+    print("  3. 模型名称错误")
+    print("  4. 网络连接问题")
+    print("  5. API 配额不足")
+    sys.exit(1)
+EOF
+
+if [ $? -eq 0 ]; then
+    echo "======================================"
+    echo "  ✅ 测试完成"
+    echo "======================================"
+    echo ""
+    echo "下一步："
+    echo "  启动服务: bash scripts/http_run.sh -p 8000"
+else
+    echo "======================================"
+    echo "  ❌ 测试失败"
+    echo "======================================"
+    exit 1
+fi