FEATURE_LIST.md

# LLM Intelligence Hub — 功能清单（Feature List）

> 文档版本：v1.1
> 日期：2026-05-09
> 状态：Phase 1 已冻结，与 PRD v0.3 / TECH v1.1 对齐

---

## 一、功能总览

按用户场景分为五大模块：

| 模块 | 核心能力 | 对应功能 |
|------|----------|----------|
| **追踪（Track）** | 实时掌握模型动态 | F1 数据采集、F2 模型基础库、F3 定价库、F4 免费政策库 |
| **查询（Query）** | 快速找到目标信息 | F6 搜索与筛选、F7 成本计算器 |
| **分析（Analyze）** | 深度理解数据 | F9 模型评测聚合、F11 趋势分析 |
| **报告（Report）** | 自动化输出 | F5 每日自动报告生成、F12 历史对比 |
| **订阅（Subscribe）** | 实时通知 | F8 价格变动告警、F13 订阅与推送 |

---

## 二、功能详细描述

### 2.1 追踪模块（Track）

---

#### F1：多源数据采集引擎

- **功能名称**：多源数据采集引擎
- **一句话描述**：自动从 OpenRouter 同步模型与定价数据（Phase 1 单数据源）
- **用户故事**：作为系统，我希望每日自动从 OpenRouter 采集最新模型信息，无需人工维护
- **功能优先级**：P0
- **Phase 归属**：Phase 1
- **技术依赖**：OpenRouter API（371+ 海外模型）
- **验收标准**：
  - [ ] OpenRouter 371+ 模型入库
  - [ ] 每日可重复采集
  - [ ] 采集失败写入日志，保留上次成功数据
  - [ ] 每条数据标注来源 URL 和置信度

---

#### F2：模型基础信息库

- **功能名称**：模型基础信息库
- **一句话描述**：存储所有模型的元数据（名称/版本/厂商/模态/上下文/能力/状态）
- **用户故事**：作为用户，我想查询某个模型的发布时间、上下文窗口、支持的 capabilities，无需跳转到多个官网
- **功能优先级**：P0
- **Phase 归属**：Phase 1
- **技术依赖**：F1 数据采集引擎；PostgreSQL Schema `model_provider` / `model`
- **验收标准**：
  - [ ] 字段完整率 > 95%（名称/版本/模态/context_length/capabilities/status）
  - [ ] 支持按厂商/模态/状态筛选
  - [ ] 模型状态变更自动追踪（active → deprecated → discontinued）

---

#### F3：区域定价数据库

- **功能名称**：区域定价数据库
- **一句话描述**：存储所有运营商 × 模型 × 区域的完整定价，支持 USD/CNY/EUR 换算与历史追踪
- **用户故事**：作为用户，我想比较"DeepSeek V4-Flash 在阿里云和硅基流动的 CNY 价格差异"，一目了然
- **功能优先级**：P0
- **Phase 归属**：Phase 1
- **技术依赖**：F1 数据采集引擎；PostgreSQL Schema `operator` / `region_pricing` / `pricing_change`
- **验收标准**：
  - [ ] 支持 CNY/USD 双视图，汇率自动更新
  - [ ] 价格变动记录保留历史，支持趋势查看
  - [ ] 每条价格标注来源 URL，标注数据质量（官方/推测/已过期）

---

#### F4：免费政策库

- **功能名称**：免费政策库
- **一句话描述**：汇总所有平台的免费模型、免费额度、限流规则与区域限制
- **用户故事**：作为小龙，我想查"中文写作性价比最高的免费模型"，5秒内找到答案
- **功能优先级**：P1
- **Phase 归属**：Phase 2
- **技术依赖**：F1 数据采集引擎（多数据源扩充后）；PostgreSQL Schema `free_tier`
- **验收标准**：
  - [ ] 覆盖 20+ 平台的免费政策
  - [ ] 包含：免费模型列表、每日/每月请求上限、Token 上限、QPS 限制、区域限制
  - [ ] 支持筛选：完全免费 / 限流免费 / 仅新用户

---

#### F11：趋势分析

- **功能名称**：趋势分析
- **一句话描述**：基于历史价格数据生成趋势图，支持周/月维度对比
- **用户故事**：作为项目经审，我想看"过去3个月 Kimi K2 的价格走势"，辅助选型决策
- **功能优先级**：P1
- **Phase 归属**：Phase 2
- **技术依赖**：F3 定价数据库；时序数据库（TimescaleDB）；图表库（ECharts）
- **验收标准**：
  - [ ] 支持 7d / 30d / 90d 趋势视图
  - [ ] 支持多模型横向对比
  - [ ] 支持价格变动时间线标注

---

### 2.2 查询模块（Query）

---

#### F6：搜索与筛选

- **功能名称**：搜索与筛选
- **一句话描述**：支持按厂商/模态/场景/价格区间/上下文长度/免费/付费的组合筛选与关键词搜索
- **用户故事**：作为立立，我想查"支持 function calling、上下文超过 100K、输入价格低于 ¥0.5 的免费模型"
- **功能优先级**：P0
- **Phase 归属**：Phase 1
- **技术依赖**：PostgreSQL 全文检索；前端筛选组件
- **验收标准**：
  - [ ] 支持多条件组合筛选（厂商 + 模态 + 价格 + 上下文 + 免费）
  - [ ] 支持关键词搜索（模型名/厂商名/特性）
  - [ ] 支持卡片视图 / 表格视图切换
  - [ ] 搜索结果 < 500ms 响应

---

#### F7：成本计算器

- **功能名称**：成本计算器
- **一句话描述**：输入 Token 数量（输入/输出分开），输出各平台成本对比排行榜，支持按月用量估算
- **用户故事**：作为财务，我想知道"月均 1000 万输入 + 500 万输出 tokens，各平台成本是多少"
- **功能优先级**：P1
- **Phase 归属**：Phase 2
- **技术依赖**：F3 定价数据库；前端计算组件
- **验收标准**：
  - [ ] 支持输入/输出 Token 分开计费
  - [ ] 输出按成本升序排列的对比表
  - [ ] 支持按月用量估算（1M / 10M / 100M / 自定义）
  - [ ] 支持货币切换（CNY/USD）

---

### 2.3 分析模块（Analyze）

---

#### F9：模型评测聚合

- **功能名称**：模型评测聚合
- **一句话描述**：汇总 MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等权威基准分，按场景排名
- **用户故事**：作为立立，我想知道"编码能力最强的开源模型是哪个"，参考评测数据做选型
- **功能优先级**：P1
- **Phase 归属**：Phase 2
- **技术依赖**：评测数据源（PapersWithCode / LM Arena）；评测数据库 Schema
- **验收标准**：
  - [ ] 覆盖 6+ 主流基准（MMLU / HumanEval / GSM8K / MATH / LiveCodeBench / SWE-Bench）
  - [ ] 支持按场景排序（编码/推理/写作/免费）
  - [ ] 评测数据标注来源和测试日期

---

### 2.4 报告模块（Report）

---

#### F5：每日自动报告生成

- **功能名称**：每日自动报告生成
- **一句话描述**：每日 08:00 自动生成 Web 页面报告，包含新模型、价格变动、免费政策变更、场景推荐
- **用户故事**：作为用户，我希望每天早上花2分钟看完报告，知道今天哪个模型最值得用
- **功能优先级**：P0
- **Phase 归属**：Phase 1
- **技术依赖**：F1/F2/F3 数据基础；Cron 调度；Markdown 输出
- **验收标准**：
  - [ ] 每日 08:00 定时触发，报告生成 < 30 秒
  - [ ] 报告内容：新模型上线、价格变动（>5% 高亮）、场景推荐
  - [ ] Markdown 文件输出到 reports/daily/ 目录
  - [ ] 报告命令可手动重放

---

#### F12：历史对比

- **功能名称**：历史对比
- **一句话描述**：支持历史报告与当前数据对比，查看模型上线/价格变化/下线的历史时间线
- **用户故事**：作为项目经审，我想看"GPT-5.4 发布前后，同类模型价格变化对比"
- **功能优先级**：P2
- **Phase 归属**：Phase 2
- **技术依赖**：F5 每日报告；`daily_report` 表；历史数据存储
- **验收标准**：
  - [ ] 支持报告版本对比（任意两天报告差异）
  - [ ] 支持模型/价格/免费政策的历史时间线
  - [ ] 支持导出对比报告（HTML/PDF）

---

### 2.5 订阅模块（Subscribe）

---

#### F8：价格变动告警

- **功能名称**：价格变动告警
- **一句话描述**：当模型价格变动超过阈值（默认 10%），自动推送告警至钉钉/飞书/Email
- **用户故事**：作为用户，我关注 DeepSeek V4-Flash，当价格涨跌超过 10% 时希望立即知道
- **功能优先级**：P1
- **Phase 归属**：Phase 2
- **技术依赖**：F3 定价数据库；变更检测逻辑；钉钉/飞书/Email 集成
- **验收标准**：
  - [ ] 可配置阈值（默认 10%，支持 5%/15%/20%）
  - [ ] 支持白名单（关注特定模型/平台）
  - [ ] 告警内容包含：模型名、原价、新价、变动幅度、来源链接
  - [ ] 支持钉钉群/飞书群/Email 三种推送方式

---

#### F13：订阅与推送

- **功能名称**：订阅与推送
- **一句话描述**：用户可订阅关注特定厂商/模型/场景，支持按订阅条件推送定制化报告
- **用户故事**：作为用户，我只关心 DeepSeek 和 Kimi，想只收到这两个厂商的价格变动通知
- **功能优先级**：P2
- **Phase 归属**：Phase 2
- **技术依赖**：F8 告警系统；订阅管理 Schema；用户偏好存储
- **验收标准**：
  - [ ] 支持按厂商/模型/场景订阅
  - [ ] 支持推送频率配置（实时/每日/每周汇总）
  - [ ] 支持 Email / 钉钉 / 飞书 三种接收渠道

---

### 2.6 进阶功能（Should Have / Could Have）

---

#### F10：API 接口

- **功能名称**：API 接口
- **一句话描述**：提供 JSON API 供 AI Agent 查询最优模型，支持 MCP Server 集成
- **用户故事**：作为宰相（AI 助理），我想调用 API 自动为用户选择最优模型，不用每次问人
- **功能优先级**：P0
- **Phase 归属**：Phase 2
- **技术依赖**：REST API 框架（FastAPI/Flask）；MCP Server 实现
- **验收标准**：
  - [ ] 提供 `/models` 查询接口（按模态/价格/场景过滤）
  - [ ] 提供 `/cost` 计算接口（输入/输出 Token 计算成本）
  - [ ] 提供 `/recommend` 推荐接口（输入场景，输出最优模型列表）
  - [ ] MCP Server 支持 OpenClaw / Claude Code 集成
  - [ ] API 响应 < 500ms

---

## 三、优先级矩阵

| 功能 ID | 功能名称 | P0 | P1 | P2 | Phase 1 | Phase 2 |
|---------|----------|----|----|----|---------|---------|
| F1 | 多源数据采集引擎 | ✅ | | | ✅ | |
| F2 | 模型基础信息库 | ✅ | | | ✅ | |
| F3 | 区域定价数据库 | ✅ | | | ✅ | |
| F6 | 搜索与筛选 | ✅ | | | ✅ | |
| F5 | 每日自动报告生成 | ✅ | | | ✅ | |
| F4 | 免费政策库 | | ✅ | | | ✅ |
| F7 | 成本计算器 | | ✅ | | | ✅ |
| F9 | 模型评测聚合 | | ✅ | | | ✅ |
| F8 | 价格变动告警 | | ✅ | | | ✅ |
| F11 | 趋势分析 | | ✅ | | | ✅ |
| F10 | API 接口 | | ✅ | | | ✅ |
| F12 | 历史对比 | | | ✅ | | ✅ |
| F13 | 订阅与推送 | | | ✅ | | ✅ |

### P0 × Phase 1 核心功能栅格

```
Phase 1 MVP 核心功能（P0）：

┌─────────────────────────────────────────────────────┐
│ F1  多源数据采集引擎                               │
│ F2  模型基础信息库                                 │
│ F3  区域定价数据库                                 │
│ F6  搜索与筛选                                     │
│ F5  每日自动报告生成                               │
└─────────────────────────────────────────────────────┘

+ P1 提升（Phase 1 纳入）：
  F4  免费政策库  → Phase 2（多数据源扩充后）
```

---

## 四、Phase 1 MVP 定义

**目标**：上线一个可用的 LLM 情报追踪系统，覆盖 20+ 厂商、500+ 模型，每日自动生成中文报告。

### MVP 功能清单（≤10 个 P0 功能 + 必要 P1）

| # | 功能 ID | 功能名称 | 优先级 | 验收条件 |
|---|---------|----------|--------|----------|
| 1 | F1 | OpenRouter 采集器 | P0 | 从 OpenRouter 自动同步 371+ 模型数据 |
| 2 | F2 | 模型基础信息库 | P0 | 模型元数据完整（名称/版本/模态/context/capabilities），支持筛选 |
| 3 | F3 | 区域定价数据库 | P0 | CNY/USD 双视图，保留历史价格，支持趋势查看 |
| 4 | F6 | 搜索与筛选 | P0 | 组合筛选（厂商+模态+价格+上下文+免费），< 500ms 响应 |
| 5 | F5 | 每日自动报告生成 | P0 | 每日 08:00 触发，生成 HTML 报告（新模型/价格变动/场景推荐） |
| 6 | — | PostgreSQL 数据库 | P0 | models/model_prices/report_runs 三张表，失败日志 |
| 7 | — | 中文界面 | P0 | 100% 汉化，前端界面友好 |
| 8 | — | Explorer 页面 | P0 | 模型表格、筛选、排序、免费标记 |
| 9 | — | Dashboard 占位图 | P0 | 价格趋势占位图，数据来自日报生成命令可重放 |

**MVP 不包含**：F4 免费政策库（Phase 1 P1，非 MVP）、成本计算器（F7）、评测聚合（F9）、告警（F8）、API 接口（F10）、趋势分析（F11）、历史对比（F12）、订阅（F13）。

---

## 五、非功能需求

### 5.1 数据准确性

| 指标 | 要求 |
|------|------|
| 数据来源标注 | 每条数据必须标注来源 URL，可溯源 |
| 置信度分级 | 官方确认 / 文档推断 / 待核实，三级标注 |
| 更新标记 | 过期数据标记"已失效"，保留历史记录 |
| 价格校验 | 同模型多源价格差异 > 20% 时告警并标注"待核实" |
| 错误处理 | 采集失败写入日志，保留上次成功数据，不覆盖旧数据 |

### 5.2 更新频率

| 数据类型 | 更新频率 | 触发方式 |
|----------|----------|----------|
| 海外模型（OpenRouter） | 每日同步 | 每日 08:00 cron |
| 国内厂商定价 | 每日同步 | 每日 08:00 cron |
| 中转平台定价 | 每日同步 | 每日 08:00 cron |
| 免费政策变更 | 变更触发 | 采集时检测到变化立即更新 |
| 价格变动 > 10% | 变更触发 | 实时检测，触发告警 |
| 模型状态变更（active/deprecated） | 变更触发 | 检测到状态变化立即更新 |

### 5.3 可用性要求

| 指标 | 要求 |
|------|------|
| 系统可用性 | 99.5%（每月停机 < 3.6 小时） |
| 报告生成 | < 30 秒（从触发到 HTML 输出） |
| API 响应 | < 500ms（/models 查询接口） |
| 数据采集成功率 | > 95%（每日采集成功率） |
| 故障恢复 | 采集失败连续 3 天触发告警；数据库每日备份 |
| 日志留存 | 30 天 |

### 5.4 技术约束

| 指标 | 要求 |
|------|------|
| 部署方式 | Docker，支持内网部署 |
| 数据库 | PostgreSQL（主）+ TimescaleDB（时序）/ SQLite（轻量版） |
| 存储估算 | 500+ 模型 × 50 字段 ≈ 100MB，每日增量 ~1MB |
| 备份策略 | 数据库每日全量备份，保留 30 天 |

---

## 六、功能依赖关系图

```
数据层（采集）
    F1 多源数据采集引擎
       ↓ 采集数据
    ┌─────────────────────────────────┐
    │                                  │
    ↓                                  ↓
F2 模型基础信息库          F3 区域定价数据库
    (Model 表)               (RegionPricing 表)
    ↓                       ↓
F4 免费政策库              F11 趋势分析
    ↓                       （依赖 F3 历史数据）
    ↓
    ┌──────────┬──────────┬──────────┐
    ↓          ↓          ↓          ↓
F6 搜索筛选  F5 报告生成  F9 评测聚合 F7 成本计算器
    ↓          ↓          ↓          ↓
    └──────────┴──────────┴──────────┘
                    ↓
               F8 价格变动告警
               F10 API 接口
               F12 历史对比
               F13 订阅与推送
```

---

## 七、Phase 2 功能概览

Phase 2 在 Phase 1 数据基础上构建增值能力：

| 功能 | 描述 | 差异化价值 |
|------|------|-----------|
| F7 成本计算器 | Token 用量成本对比 | 与竞品（硅基流动/AgentDeals）拉开差距的核心功能 |
| F9 模型评测聚合 | 基准分排行 | 参考 Artificial Analysis，但聚合中文可用数据 |
| F8 价格变动告警 | >10% 变动实时推送 | OpenRouter/硅基流动均无此功能 |
| F11 趋势分析 | 历史价格趋势图 | AgentDeals 有部分功能，但无中文界面和 CNY 视图 |
| F10 API 接口 | JSON API + MCP Server | 竞品均无 —— 差异化核心，AI Agent 集成入口 |
| F12 历史对比 | 报告版本对比 | 独有功能，增强数据价值 |
| F13 订阅与推送 | 定制化订阅 | 提升用户粘性，与钉钉/飞书深度集成 |

---

**文档状态**：初稿完成，待评审

---

*最后更新：2026-05-04 by 宰相（AI 辅助）*

---

## 三、容错与降级设计

每个功能必须包含降级策略：
- F1 采集器失败：前端显示上次成功数据 + stale 标记 + 人工检查入口
- F2 模型库查询失败：返回缓存快照，提示"数据可能不是最新"
- F3 定价库缺失：显示 "pricing unavailable" 而非空白或 0
- F5 日报生成失败：保留上日报，标题加 "[数据延迟]"
- F6 搜索失败：降级为简单列表展示，保留筛选框
- 全局降级开关：维护模式页面，提示服务状态
-												chore: prepare repository for publishing

											
										
										
											2026-05-13 14:42:45 +08:00
+								# LLM Intelligence Hub — 功能清单（Feature List）
 								> 文档版本：v1.1
 								> 日期：2026-05-09
 								> 状态：Phase 1 已冻结，与 PRD v0.3 / TECH v1.1 对齐
 								---
 								## 一、功能总览
 								按用户场景分为五大模块：
 								| 模块 | 核心能力 | 对应功能 |
 								|------|----------|----------|
 								| **追踪（Track）** | 实时掌握模型动态 | F1 数据采集、F2 模型基础库、F3 定价库、F4 免费政策库 |
 								| **查询（Query）** | 快速找到目标信息 | F6 搜索与筛选、F7 成本计算器 |
 								| **分析（Analyze）** | 深度理解数据 | F9 模型评测聚合、F11 趋势分析 |
 								| **报告（Report）** | 自动化输出 | F5 每日自动报告生成、F12 历史对比 |
 								| **订阅（Subscribe）** | 实时通知 | F8 价格变动告警、F13 订阅与推送 |
 								---
 								## 二、功能详细描述
 								### 2.1 追踪模块（Track）
 								---
 								#### F1：多源数据采集引擎
 								- **功能名称**：多源数据采集引擎
 								- **一句话描述**：自动从 OpenRouter 同步模型与定价数据（Phase 1 单数据源）
 								- **用户故事**：作为系统，我希望每日自动从 OpenRouter 采集最新模型信息，无需人工维护
 								- **功能优先级**：P0
 								- **Phase 归属**：Phase 1
 								- **技术依赖**：OpenRouter API（371+ 海外模型）
 								- **验收标准**：
 								  - [ ] OpenRouter 371+ 模型入库
 								  - [ ] 每日可重复采集
 								  - [ ] 采集失败写入日志，保留上次成功数据
 								  - [ ] 每条数据标注来源 URL 和置信度
 								---
 								#### F2：模型基础信息库
 								- **功能名称**：模型基础信息库
 								- **一句话描述**：存储所有模型的元数据（名称/版本/厂商/模态/上下文/能力/状态）
 								- **用户故事**：作为用户，我想查询某个模型的发布时间、上下文窗口、支持的 capabilities，无需跳转到多个官网
 								- **功能优先级**：P0
 								- **Phase 归属**：Phase 1
 								- **技术依赖**：F1 数据采集引擎；PostgreSQL Schema `model_provider` / `model`
 								- **验收标准**：
 								  - [ ] 字段完整率 > 95%（名称/版本/模态/context_length/capabilities/status）
 								  - [ ] 支持按厂商/模态/状态筛选
 								  - [ ] 模型状态变更自动追踪（active → deprecated → discontinued）
 								---
 								#### F3：区域定价数据库
 								- **功能名称**：区域定价数据库
 								- **一句话描述**：存储所有运营商 × 模型 × 区域的完整定价，支持 USD/CNY/EUR 换算与历史追踪
 								- **用户故事**：作为用户，我想比较"DeepSeek V4-Flash 在阿里云和硅基流动的 CNY 价格差异"，一目了然
 								- **功能优先级**：P0
 								- **Phase 归属**：Phase 1
 								- **技术依赖**：F1 数据采集引擎；PostgreSQL Schema `operator` / `region_pricing` / `pricing_change`
 								- **验收标准**：
 								  - [ ] 支持 CNY/USD 双视图，汇率自动更新
 								  - [ ] 价格变动记录保留历史，支持趋势查看
 								  - [ ] 每条价格标注来源 URL，标注数据质量（官方/推测/已过期）
 								---
 								#### F4：免费政策库
 								- **功能名称**：免费政策库
 								- **一句话描述**：汇总所有平台的免费模型、免费额度、限流规则与区域限制
 								- **用户故事**：作为小龙，我想查"中文写作性价比最高的免费模型"，5秒内找到答案
 								- **功能优先级**：P1
 								- **Phase 归属**：Phase 2
 								- **技术依赖**：F1 数据采集引擎（多数据源扩充后）；PostgreSQL Schema `free_tier`
 								- **验收标准**：
 								  - [ ] 覆盖 20+ 平台的免费政策
 								  - [ ] 包含：免费模型列表、每日/每月请求上限、Token 上限、QPS 限制、区域限制
 								  - [ ] 支持筛选：完全免费 / 限流免费 / 仅新用户
 								---
 								#### F11：趋势分析
 								- **功能名称**：趋势分析
 								- **一句话描述**：基于历史价格数据生成趋势图，支持周/月维度对比
 								- **用户故事**：作为项目经审，我想看"过去3个月 Kimi K2 的价格走势"，辅助选型决策
 								- **功能优先级**：P1
 								- **Phase 归属**：Phase 2
 								- **技术依赖**：F3 定价数据库；时序数据库（TimescaleDB）；图表库（ECharts）
 								- **验收标准**：
 								  - [ ] 支持 7d / 30d / 90d 趋势视图
 								  - [ ] 支持多模型横向对比
 								  - [ ] 支持价格变动时间线标注
 								---
 								### 2.2 查询模块（Query）
 								---
 								#### F6：搜索与筛选
 								- **功能名称**：搜索与筛选
 								- **一句话描述**：支持按厂商/模态/场景/价格区间/上下文长度/免费/付费的组合筛选与关键词搜索
 								- **用户故事**：作为立立，我想查"支持 function calling、上下文超过 100K、输入价格低于 ¥0.5 的免费模型"
 								- **功能优先级**：P0
 								- **Phase 归属**：Phase 1
 								- **技术依赖**：PostgreSQL 全文检索；前端筛选组件
 								- **验收标准**：
 								  - [ ] 支持多条件组合筛选（厂商 + 模态 + 价格 + 上下文 + 免费）
 								  - [ ] 支持关键词搜索（模型名/厂商名/特性）
 								  - [ ] 支持卡片视图 / 表格视图切换
 								  - [ ] 搜索结果 < 500ms 响应
 								---
 								#### F7：成本计算器
 								- **功能名称**：成本计算器
 								- **一句话描述**：输入 Token 数量（输入/输出分开），输出各平台成本对比排行榜，支持按月用量估算
 								- **用户故事**：作为财务，我想知道"月均 1000 万输入 + 500 万输出 tokens，各平台成本是多少"
 								- **功能优先级**：P1
 								- **Phase 归属**：Phase 2
 								- **技术依赖**：F3 定价数据库；前端计算组件
 								- **验收标准**：
 								  - [ ] 支持输入/输出 Token 分开计费
 								  - [ ] 输出按成本升序排列的对比表
 								  - [ ] 支持按月用量估算（1M / 10M / 100M / 自定义）
 								  - [ ] 支持货币切换（CNY/USD）
 								---
 								### 2.3 分析模块（Analyze）
 								---
 								#### F9：模型评测聚合
 								- **功能名称**：模型评测聚合
 								- **一句话描述**：汇总 MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等权威基准分，按场景排名
 								- **用户故事**：作为立立，我想知道"编码能力最强的开源模型是哪个"，参考评测数据做选型
 								- **功能优先级**：P1
 								- **Phase 归属**：Phase 2
 								- **技术依赖**：评测数据源（PapersWithCode / LM Arena）；评测数据库 Schema
 								- **验收标准**：
 								  - [ ] 覆盖 6+ 主流基准（MMLU / HumanEval / GSM8K / MATH / LiveCodeBench / SWE-Bench）
 								  - [ ] 支持按场景排序（编码/推理/写作/免费）
 								  - [ ] 评测数据标注来源和测试日期
 								---
 								### 2.4 报告模块（Report）
 								---
 								#### F5：每日自动报告生成
 								- **功能名称**：每日自动报告生成
 								- **一句话描述**：每日 08:00 自动生成 Web 页面报告，包含新模型、价格变动、免费政策变更、场景推荐
 								- **用户故事**：作为用户，我希望每天早上花2分钟看完报告，知道今天哪个模型最值得用
 								- **功能优先级**：P0
 								- **Phase 归属**：Phase 1
 								- **技术依赖**：F1/F2/F3 数据基础；Cron 调度；Markdown 输出
 								- **验收标准**：
 								  - [ ] 每日 08:00 定时触发，报告生成 < 30 秒
 								  - [ ] 报告内容：新模型上线、价格变动（>5% 高亮）、场景推荐
 								  - [ ] Markdown 文件输出到 reports/daily/ 目录
 								  - [ ] 报告命令可手动重放
 								---
 								#### F12：历史对比
 								- **功能名称**：历史对比
 								- **一句话描述**：支持历史报告与当前数据对比，查看模型上线/价格变化/下线的历史时间线
 								- **用户故事**：作为项目经审，我想看"GPT-5.4 发布前后，同类模型价格变化对比"
 								- **功能优先级**：P2
 								- **Phase 归属**：Phase 2
 								- **技术依赖**：F5 每日报告；`daily_report` 表；历史数据存储
 								- **验收标准**：
 								  - [ ] 支持报告版本对比（任意两天报告差异）
 								  - [ ] 支持模型/价格/免费政策的历史时间线
 								  - [ ] 支持导出对比报告（HTML/PDF）
 								---
 								### 2.5 订阅模块（Subscribe）
 								---
 								#### F8：价格变动告警
 								- **功能名称**：价格变动告警
 								- **一句话描述**：当模型价格变动超过阈值（默认 10%），自动推送告警至钉钉/飞书/Email
 								- **用户故事**：作为用户，我关注 DeepSeek V4-Flash，当价格涨跌超过 10% 时希望立即知道
 								- **功能优先级**：P1
 								- **Phase 归属**：Phase 2
 								- **技术依赖**：F3 定价数据库；变更检测逻辑；钉钉/飞书/Email 集成
 								- **验收标准**：
 								  - [ ] 可配置阈值（默认 10%，支持 5%/15%/20%）
 								  - [ ] 支持白名单（关注特定模型/平台）
 								  - [ ] 告警内容包含：模型名、原价、新价、变动幅度、来源链接
 								  - [ ] 支持钉钉群/飞书群/Email 三种推送方式
 								---
 								#### F13：订阅与推送
 								- **功能名称**：订阅与推送
 								- **一句话描述**：用户可订阅关注特定厂商/模型/场景，支持按订阅条件推送定制化报告
 								- **用户故事**：作为用户，我只关心 DeepSeek 和 Kimi，想只收到这两个厂商的价格变动通知
 								- **功能优先级**：P2
 								- **Phase 归属**：Phase 2
 								- **技术依赖**：F8 告警系统；订阅管理 Schema；用户偏好存储
 								- **验收标准**：
 								  - [ ] 支持按厂商/模型/场景订阅
 								  - [ ] 支持推送频率配置（实时/每日/每周汇总）
 								  - [ ] 支持 Email / 钉钉 / 飞书 三种接收渠道
 								---
 								### 2.6 进阶功能（Should Have / Could Have）
 								---
 								#### F10：API 接口
 								- **功能名称**：API 接口
 								- **一句话描述**：提供 JSON API 供 AI Agent 查询最优模型，支持 MCP Server 集成
 								- **用户故事**：作为宰相（AI 助理），我想调用 API 自动为用户选择最优模型，不用每次问人
 								- **功能优先级**：P0
 								- **Phase 归属**：Phase 2
 								- **技术依赖**：REST API 框架（FastAPI/Flask）；MCP Server 实现
 								- **验收标准**：
 								  - [ ] 提供 `/models` 查询接口（按模态/价格/场景过滤）
 								  - [ ] 提供 `/cost` 计算接口（输入/输出 Token 计算成本）
 								  - [ ] 提供 `/recommend` 推荐接口（输入场景，输出最优模型列表）
 								  - [ ] MCP Server 支持 OpenClaw / Claude Code 集成
 								  - [ ] API 响应 < 500ms
 								---
 								## 三、优先级矩阵
 								| 功能 ID | 功能名称 | P0 | P1 | P2 | Phase 1 | Phase 2 |
 								|---------|----------|----|----|----|---------|---------|
 								| F1 | 多源数据采集引擎 | ✅ | | | ✅ | |
 								| F2 | 模型基础信息库 | ✅ | | | ✅ | |
 								| F3 | 区域定价数据库 | ✅ | | | ✅ | |
 								| F6 | 搜索与筛选 | ✅ | | | ✅ | |
 								| F5 | 每日自动报告生成 | ✅ | | | ✅ | |
 								| F4 | 免费政策库 | | ✅ | | | ✅ |
 								| F7 | 成本计算器 | | ✅ | | | ✅ |
 								| F9 | 模型评测聚合 | | ✅ | | | ✅ |
 								| F8 | 价格变动告警 | | ✅ | | | ✅ |
 								| F11 | 趋势分析 | | ✅ | | | ✅ |
 								| F10 | API 接口 | | ✅ | | | ✅ |
 								| F12 | 历史对比 | | | ✅ | | ✅ |
 								| F13 | 订阅与推送 | | | ✅ | | ✅ |
 								### P0 × Phase 1 核心功能栅格
 								```
 								Phase 1 MVP 核心功能（P0）：
 								┌─────────────────────────────────────────────────────┐
 								│ F1  多源数据采集引擎                               │
 								│ F2  模型基础信息库                                 │
 								│ F3  区域定价数据库                                 │
 								│ F6  搜索与筛选                                     │
 								│ F5  每日自动报告生成                               │
 								└─────────────────────────────────────────────────────┘
 								+ P1 提升（Phase 1 纳入）：
 								  F4  免费政策库  → Phase 2（多数据源扩充后）
 								```
 								---
 								## 四、Phase 1 MVP 定义
 								**目标**：上线一个可用的 LLM 情报追踪系统，覆盖 20+ 厂商、500+ 模型，每日自动生成中文报告。
 								### MVP 功能清单（≤10 个 P0 功能 + 必要 P1）
 								| # | 功能 ID | 功能名称 | 优先级 | 验收条件 |
 								|---|---------|----------|--------|----------|
 								| 1 | F1 | OpenRouter 采集器 | P0 | 从 OpenRouter 自动同步 371+ 模型数据 |
 								| 2 | F2 | 模型基础信息库 | P0 | 模型元数据完整（名称/版本/模态/context/capabilities），支持筛选 |
 								| 3 | F3 | 区域定价数据库 | P0 | CNY/USD 双视图，保留历史价格，支持趋势查看 |
 								| 4 | F6 | 搜索与筛选 | P0 | 组合筛选（厂商+模态+价格+上下文+免费），< 500ms 响应 |
 								| 5 | F5 | 每日自动报告生成 | P0 | 每日 08:00 触发，生成 HTML 报告（新模型/价格变动/场景推荐） |
 								| 6 | — | PostgreSQL 数据库 | P0 | models/model_prices/report_runs 三张表，失败日志 |
 								| 7 | — | 中文界面 | P0 | 100% 汉化，前端界面友好 |
 								| 8 | — | Explorer 页面 | P0 | 模型表格、筛选、排序、免费标记 |
 								| 9 | — | Dashboard 占位图 | P0 | 价格趋势占位图，数据来自日报生成命令可重放 |
 								**MVP 不包含**：F4 免费政策库（Phase 1 P1，非 MVP）、成本计算器（F7）、评测聚合（F9）、告警（F8）、API 接口（F10）、趋势分析（F11）、历史对比（F12）、订阅（F13）。
 								---
 								## 五、非功能需求
 								### 5.1 数据准确性
 								| 指标 | 要求 |
 								|------|------|
 								| 数据来源标注 | 每条数据必须标注来源 URL，可溯源 |
 								| 置信度分级 | 官方确认 / 文档推断 / 待核实，三级标注 |
 								| 更新标记 | 过期数据标记"已失效"，保留历史记录 |
 								| 价格校验 | 同模型多源价格差异 > 20% 时告警并标注"待核实" |
 								| 错误处理 | 采集失败写入日志，保留上次成功数据，不覆盖旧数据 |
 								### 5.2 更新频率
 								| 数据类型 | 更新频率 | 触发方式 |
 								|----------|----------|----------|
 								| 海外模型（OpenRouter） | 每日同步 | 每日 08:00 cron |
 								| 国内厂商定价 | 每日同步 | 每日 08:00 cron |
 								| 中转平台定价 | 每日同步 | 每日 08:00 cron |
 								| 免费政策变更 | 变更触发 | 采集时检测到变化立即更新 |
 								| 价格变动 > 10% | 变更触发 | 实时检测，触发告警 |
 								| 模型状态变更（active/deprecated） | 变更触发 | 检测到状态变化立即更新 |
 								### 5.3 可用性要求
 								| 指标 | 要求 |
 								|------|------|
 								| 系统可用性 | 99.5%（每月停机 < 3.6 小时） |
 								| 报告生成 | < 30 秒（从触发到 HTML 输出） |
 								| API 响应 | < 500ms（/models 查询接口） |
 								| 数据采集成功率 | > 95%（每日采集成功率） |
 								| 故障恢复 | 采集失败连续 3 天触发告警；数据库每日备份 |
 								| 日志留存 | 30 天 |
 								### 5.4 技术约束
 								| 指标 | 要求 |
 								|------|------|
 								| 部署方式 | Docker，支持内网部署 |
 								| 数据库 | PostgreSQL（主）+ TimescaleDB（时序）/ SQLite（轻量版） |
 								| 存储估算 | 500+ 模型 × 50 字段 ≈ 100MB，每日增量 ~1MB |
 								| 备份策略 | 数据库每日全量备份，保留 30 天 |
 								---
 								## 六、功能依赖关系图
 								```
 								数据层（采集）
 								    F1 多源数据采集引擎
 								       ↓ 采集数据
 								    ┌─────────────────────────────────┐
 								    │                                  │
 								    ↓                                  ↓
 								F2 模型基础信息库          F3 区域定价数据库
 								    (Model 表)               (RegionPricing 表)
 								    ↓                       ↓
 								F4 免费政策库              F11 趋势分析
 								    ↓                       （依赖 F3 历史数据）
 								    ↓
 								    ┌──────────┬──────────┬──────────┐
 								    ↓          ↓          ↓          ↓
 								F6 搜索筛选  F5 报告生成  F9 评测聚合 F7 成本计算器
 								    ↓          ↓          ↓          ↓
 								    └──────────┴──────────┴──────────┘
 								                    ↓
 								               F8 价格变动告警
 								               F10 API 接口
 								               F12 历史对比
 								               F13 订阅与推送
 								```
 								---
 								## 七、Phase 2 功能概览
 								Phase 2 在 Phase 1 数据基础上构建增值能力：
 								| 功能 | 描述 | 差异化价值 |
 								|------|------|-----------|
 								| F7 成本计算器 | Token 用量成本对比 | 与竞品（硅基流动/AgentDeals）拉开差距的核心功能 |
 								| F9 模型评测聚合 | 基准分排行 | 参考 Artificial Analysis，但聚合中文可用数据 |
 								| F8 价格变动告警 | >10% 变动实时推送 | OpenRouter/硅基流动均无此功能 |
 								| F11 趋势分析 | 历史价格趋势图 | AgentDeals 有部分功能，但无中文界面和 CNY 视图 |
 								| F10 API 接口 | JSON API + MCP Server | 竞品均无 —— 差异化核心，AI Agent 集成入口 |
 								| F12 历史对比 | 报告版本对比 | 独有功能，增强数据价值 |
 								| F13 订阅与推送 | 定制化订阅 | 提升用户粘性，与钉钉/飞书深度集成 |
 								---
 								**文档状态**：初稿完成，待评审
 								---
 								*最后更新：2026-05-04 by 宰相（AI 辅助）*
 								---
 								## 三、容错与降级设计
 								每个功能必须包含降级策略：
 								- F1 采集器失败：前端显示上次成功数据 + stale 标记 + 人工检查入口
 								- F2 模型库查询失败：返回缓存快照，提示"数据可能不是最新"
 								- F3 定价库缺失：显示 "pricing unavailable" 而非空白或 0
 								- F5 日报生成失败：保留上日报，标题加 "[数据延迟]"
 								- F6 搜索失败：降级为简单列表展示，保留筛选框
 								- 全局降级开关：维护模式页面，提示服务状态