# LLM Intelligence Hub — 产品需求文档 v0.3

> 文档版本：v0.3
> 日期：2026-05-09
> 负责人：宰相（AI 辅助）
> 状态：Phase 1 已冻结，执行中（采集器/数据库/日报已落地）

---

## 一、产品概述

### 1.1 背景

**大模型市场竞争格局**（2026年5月最新）：
- **国内第一梯队**：DeepSeek V3.2 / V4-Flash（RMB最低价）+ Kimi K2.6（首个超越GPT-5.4的开源模型）+ Qwen3.6（开源最强）+ GLM-5.1（综合）
- **海外第一梯队**：xAI Grok 4.1 Fast（$0.20/M，史上最便宜前沿模型）+ Claude Opus 4.6（降价67%至$5/$25）+ GPT-5系列
- **云平台**：阿里云、腾讯云、百度云、华为云、火山引擎（字节）等国内平台；AWS Bedrock、Azure OpenAI、Google Cloud 等海外平台
- **中转聚合**：硅基流动（SiliconFlow）、OpenRouter、Together AI、Groq、Cloudflare Workers AI 等

**核心痛点**：
1. 模型信息极度分散——定价页、API 文档、公告分布在几十个平台
2. 区域价格差异大——同一模型在中国区和国际区价格可能完全不同
3. 免费政策不透明——免费额度、限流规则、区域限制缺乏统一汇总
4. 中转平台价格战激烈——硅基流动、OpenRouter 等价格差异显著
5. 信息更新滞后——人工维护成本高，无法实时追踪快速变化的定价

### 1.2 目标

**建立一个覆盖全球的 LLM 情报数据库**，持续追踪：
- **模型商**：基础模型能力、版本迭代、发布动态
- **运营商/云平台**：各区域定价、计费模式、免费额度
- **中转站**：聚合 API 价格、对接稳定性、服务质量

**最终输出**：每日自动生成可视化报告（Web 页面），支持历史对比和趋势分析。

### 1.3 成功指标

| 指标 | 目标值（Phase 1） |
|------|------------------|
| 模型商覆盖率 | 国内外 20+ 主流厂商 |
| 运营商覆盖 | 30+ 云平台/中转站 |
| 模型总量 | 500+ 模型条目 |
| 更新频率 | 每日增量同步 |
| 报告生成 | 每日 08:00 自动触发 |
| 中文界面 | 100% 汉化 |

---

## 二、Phase 1 范围

### 范围
- 聚焦模型定价数据：采集 → 存储 → 报告三条链路落地
- 单条链路覆盖：OpenRouter（采集器）、PostgreSQL（存储）、Markdown 日报（报告输出到 reports/daily/）
- Explorer 页面：模型表格，支持筛选、排序、免费标记
- Dashboard 占位图：价格趋势示意（数据来自日报生成命令可重放）

### 非目标
- ❌ 多租户、用户登录、权限系统
- ❌ 图表组件库（用占位图替代）
- ❌ 邮件/飞书/...推送
- ❌ 多数据源并行采集（Phase 2 才扩展 OpenRouter/Together/Groq 等）

### 验收标准
1. scripts/fetch_openrouter.go 存在且可单独运行，抓取结果写入 PostgreSQL
2. db/migrations/*.sql 落地三张表：models、model_prices、report_runs
3. 日报生成命令运行后在 reports/daily/ 目录产出 Markdown 文件

## 三、数据模型设计

### 2.1 核心实体

```
LLM Intelligence Hub
│
├── ModelProvider（模型商）
│   ├── name（名称）: "OpenAI" / "百度" / "DeepSeek"
│   ├── country（国籍）: "US" / "CN" / "EU"
│   ├── website: 官网
│   ├── founded: 成立时间
│   └── models[] → Model（下属模型列表）
│
├── Model（模型）
│   ├── id: 全局唯一标识
│   ├── provider_id → ModelProvider
│   ├── name: "GPT-4o" / "ERNIE-4.0" / "Qwen-72B"
│   ├── version: 版本号（如 "2025-12"）
│   ├── modality（模态）: text / vision / audio / video / code
│   ├── context_length: 上下文窗口（tokens）
│   ├── capabilities[]: ["function_calling", "json_mode", "vision"]
│   ├── release_date: 发布时间
│   ├── status: active / deprecated / discontinued
│   └── parent_model（父模型）: 用于区分 Turbo/Lite 等变体
│
├── Operator（运营商/云平台）
│   ├── name: "阿里云" / "AWS" / "硅基流动"
│   ├── type: "cloud"（云厂商）/ "reseller"（中转）/ "official"（官方直销）
│   ├── country: 运营主体国籍
│   ├── website: 控制台地址
│   ├── api_endpoint: API 地址
│   ├── auth_type: "api_key" / "oauth" / "STS"
│   └── region_pricing[] → RegionPricing（各区域定价）
│
├── RegionPricing（区域定价）
│   ├── id
│   ├── operator_id → Operator
│   ├── model_id → Model（哪个模型在此平台有售）
│   ├── region: "CN" / "US" / "EU" / "GLOBAL"
│   ├── currency: "CNY" / "USD" / "EUR"
│   ├── input_price_per_mtok: 输入价格（元/百万 Token）
│   ├── output_price_per_mtok: 输出价格
│   ├── free_tier（免费层）: 描述免费额度
│   ├── free_limitations[]: ["每日限100次", "仅限国内IP"]
│   ├── rate_limit: 限流规则
│   ├── last_updated: 最后更新
│   └── source_url: 价格页/文档链接
│
├── PricingChange（价格变动记录）
│   ├── id
│   ├── model_id → Model
│   ├── operator_id → Operator
│   ├── region
│   ├── old_price / new_price
│   ├── change_date
│   └── change_type: increase / decrease / new_model / discontinued
│
└── DailyReport（每日报告）
    ├── id
    ├── report_date
    ├── new_models[]: 今日新上线模型
    ├── price_changes[]: 价格变动
    ├── free_policy_changes[]: 免费政策变更
    ├── top_recommendations{}: 场景推荐
    └── html_content: Web 报告内容
```

### 2.2 数据来源映射

| 数据类型 | 主要来源 | 获取方式 |
|----------|----------|----------|
| **海外模型商** | OpenRouter API（371 模型） | API 自动同步 |
| **国内模型商** | 各厂商开放平台（ERNIE/Qwen/Hunyuan/Doubao 等） | 官方 API / 文档解析 |
| **云平台定价** | AWS/Azure/阿里云/腾讯云/华为云定价页 | 官方 API / 正则解析 |
| **中转站定价** | OpenRouter / SiliconFlow / Together AI / Groq | API 同步 |
| **免费政策** | 各平台开发者文档 | 文档解析 + 人工补充 |
| **区域差异** | 各云平台区域定价页 | 多区域页面对比 |

---

## 四、功能需求

### 3.1 数据采集层（Must Have）

#### F1：多源数据采集
- **OpenRouter API**：371+ 海外模型，实时同步（定价/上下文/能力）
- **国内厂商 API**：百度 Qianfan、阿里 DashScope、腾讯混元、字节火山引擎、DeepSeek、智谱 BigModel
- **中转平台**：硅基流动 API、OpenRouter API（国内节点）、Together AI
- **更新策略**：每日 08:00 全量同步 + 变更触发增量更新
- **错误处理**：采集失败写入日志，保留上次成功数据，标记"数据待核实"

#### F2：模型基础信息库
- 模型名称、版本、发布商、发布时间
- 模态（文字/图片/音频/视频/代码）
- 上下文窗口、Capabilities（function calling / JSON mode / Vision）
- 模型状态（active / deprecated / discontinued）

#### F3：定价数据库
- 按运营商 × 模型 × 区域存储完整定价
- 支持货币自动换算（USD/CNY/EUR）
- 保留历史价格，支持趋势查看
- 标注价格数据质量（官方 / 推测 / 已过期）

#### F4：免费政策库
- 各平台免费模型列表
- 免费额度（每日/每月请求次数、Token 上限）
- 限流规则（QPS、并发、冷却时间）
- 区域限制（仅某地区可用、仅某用户类型可用）
- 特殊情况（限时免费、活动到期时间）

### 3.2 应用层（Must Have）

#### F5：每日自动报告生成
- **触发**：每日 08:00 cron
- **内容**：
  1. 今日新上线 / 更新的模型
  2. 价格变动提醒（>5% 变动高亮）
  3. 免费政策变更
  4. 场景推荐 TOP 10（编码/写作/推理/免费/低成本）
  5. 成本优化建议（同能力更低价格选项）
- **格式**：HTML Web 页面（内网可访问）+ PDF 导出
- **分发**：支持推送至钉钉群/飞书群/Email

#### F6：搜索与筛选
- **筛选**：厂商 / 模态 / 场景 / 价格区间 / 上下文长度 / 免费/付费
- **搜索**：模型名、厂商名、特性关键词
- **视图**：卡片视图 / 表格视图 / 趋势图

#### F7：成本计算器
- 输入：Token 数量（输入/输出分开）
- 输出：各平台/运营商成本对比排行榜
- 支持按月用量估算

### 3.3 进阶功能（Should Have）

#### F8：价格变动告警
- 触发条件：价格变动 > 10%（可配置）
- 通知方式：钉钉/飞书/Email 推送
- 白名单：用户关注特定模型/平台

#### F9：模型评测聚合
- MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等基准分
- 按场景排名（编码/推理/写作/免费）

#### F10：API 接口
- JSON API 供 AI Agent 查询最优模型
- MCP Server 供 OpenClaw/Claude Code 等集成

---

## 五、覆盖范围

### 4.1 模型商（目标 20+）

#### 国内厂商（目标 12 家，2026-05 实际定价）
| 厂商 | 代表模型 | 输入 CNY/MT | 输出 CNY/MT | 最新动态 |
|------|----------|-----------|-----------|----------|
| DeepSeek | V3.2 / V4-Flash / R1 | ¥0.14-0.27 | ¥0.028-0.135 | V4-Flash：全球最便宜1M context |
| 阿里 | Qwen3-VL-32B / 8B | ¥0.18-0.20 | ¥0.60-0.68 | Qwen3.6 开源性能逼近闭源 |
| Moonshot | Kimi K2.6 / K2.5 | ¥0.23-0.95 | ¥0.07-0.16 | K2.6 超越 GPT-5.4（SWE-Bench Pro） |
| 智谱 | GLM-5.1 / GLM-4.7 | ¥0.42-1.40 | ¥0.11-0.26 | GLM-5.1 编码能力接近 Opus 4.6 |
| MiniMax | M2.5 | ¥0.30 | ¥0.03 | 多模态+语音，API 性价比极高 |
| 字节 | Doubao / Step-3.5-Flash | ¥0.10+ | — | Step-3.5 Flash 约 GPT-4o 的 1/25 价格 |
| 百度 | ERNIE-4.5-300B | ¥0.28 | ¥1.10 | 老牌旗舰，搜索集成 |
| 腾讯 | Hunyuan-A13B | ¥0.14 | ¥0.57 | 腾讯系生态集成 |
| 华为 | Pangu-4 / 3 | 企业定价 | 企业定价 | 政务/国企客户多 |
| 讯飞 | Spark-4.0 | 企业定价 | 企业定价 | 语音交互强 |
| 零一万物 | Yi-Large | 企业定价 | 企业定价 | 开源 Yi 系列 |
| 昆仑万维 | Skywork-13B | 企业定价 | 企业定价 | 开源系列 |

#### 海外厂商（目标 10 家）
| 厂商 | 代表模型 | API 平台 |
|------|----------|----------|
| OpenAI | GPT-4o / GPT-4.5 / o3 / o4 | platform.openai.com |
| Anthropic | Claude 3.5 Sonnet / Claude 4 | console.anthropic.com |
| Google | Gemini 2.0 / Gemini 1.5 | ai.google.dev |
| Meta | Llama 4 / Llama 3.3 | (via Azure/单独部署) |
| xAI | Grok-3 / Grok-4 | x.ai |
| Mistral | Mistral Large / Codestral | mistral.ai |
| Cohere | Command R+ / Command | Cohere |
| Perplexity | Sonar (Pro/Rtel) | perplexity.ai |
| Amazon | Claude/Gemini/Llama (on Bedrock) | AWS Bedrock |
| Microsoft | GPT-4 (on Azure) | Azure OpenAI |

### 4.2 运营商/云平台（目标 30+）

#### 国内云厂商（8 家）
| 平台 | 网址 | 主力模型 |
|------|------|----------|
| 阿里云 | aliyun.com | Qwen / 通义全系 |
| 腾讯云 | cloud.tencent.com | Hunyuan 全系 |
| 百度智能云 | cloud.baidu.com | ERNIE 全系 |
| 华为云 | huaweicloud.com | Pangu 全系 |
| 火山引擎 | volcengine.com | Doubao 全系 |
| 京东云 | jdcloud.com | 言犀（自研） |
| 电信天翼云 | ctyun.cn | （接入第三方模型） |
| 移动云 | cmcc.cn | （接入第三方模型） |

#### 国内中转/聚合（5 家）
| 平台 | 网址 | 特色 |
|------|------|------|
| 硅基流动 | siliconflow.cn | 国内最便宜中转之一 |
| OpenAI 中转 | openai-sg.com 等 | 直连/新加坡节点 |
| DeepSeek 中转 | 多家 | 国内访问 DeepSeek |
| Azure 中转 | 多家 | 绕过 Azure 限制 |
| Claude 中转 | 多家 | 国内访问 Claude |

#### 海外云厂商（6 家）
| 平台 | 网址 | 主力模型 |
|------|------|----------|
| AWS Bedrock | aws.amazon.com/bedrock | Claude/Gemini/Llama/Titan |
| Azure OpenAI | azure.microsoft.com | GPT-4/GPT-4o |
| Google Cloud | cloud.google.com | Gemini/PaLM |
| Cloudflare Workers AI | developers.cloudflare.com/workers-ai | Llama/Gemma 等 |
| Oracle Cloud AI | oracle.com/cloud | Llama/Mistral |
| IBM watsonx | ibm.com/watsonx | Granite/Maestro |

#### 海外中转聚合（8 家）
| 平台 | 网址 | 特色 |
|------|------|------|
| OpenRouter | openrouter.ai | 371+ 模型，ELO 排行，免费模型多 |
| Together AI | together.ai | 开源模型为主 |
| Groq | console.groq.com | 高速推理（Llama/Mixtral） |
| Replicate | replicate.com | 镜像部署，方便 |
| Anyscale | anyscale.com | Ray serving |
| Fireworks AI | fireworks.ai | 高速开源模型 |
| Lepton AI | lepton.ai | 按需计费 |
| Perplexity API | perplexity.ai | Sonar 模型专属 |

---

## 六、竞品对比

| 维度 | OpenRouter | AgentDeals | 硅基流动 | Artificial Analysis | **LLM Intelligence Hub** |
|------|------------|------------|----------|---------------------|----------------------|
| 模型数量 | 371+ | 19+ | 50+ | 不明 | **500+** |
| 实时数据 | ✅ API | ✅ 月更 | ✅ API | 定期 | **✅ 每日** |
| CNY 定价 | ❌ | ❌ | ✅ | ❌ | **✅** |
| USD 定价 | ✅ | ✅ | 部分 | ✅ | **✅** |
| 国内厂商 | 有限 | 有限 | ✅全 | ❌ | **✅ 12家** |
| 免费政策 | ✅ 标记 | ✅ 详细 | ✅ | ✅ 基础 | **✅ 详细追踪** |
| 性能评测 | ❌ | ❌ | ❌ | ✅ | **✅ 聚合** |
| 告警通知 | ❌ | ❌ | ❌ | ❌ | **✅** |
| 每日报告 | ❌ | ❌ | ❌ | ❌ | **✅** |
| 中文界面 | ❌ | ❌ | ✅ | ❌ | **✅** |
| Web 界面 | ✅ | ✅ | ✅ | ✅付费 | **✅** |
| MCP Server | ❌ | ❌ | ❌ | ❌ | **✅** |

---

## 七、里程碑

| Phase | 时间 | 目标 | 关键交付 |
|-------|------|------|----------|
| **Phase 1** | 2026-Q2 | MVP 上线 | 采集+存储+日报+Explorer |
| **Phase 2** | 2026-Q3 | 多数据源+告警 | 国内厂商采集+推送+趋势图 |
| **Phase 3** | 2026-Q4 | 商业化 | 订阅付费+API+MCP Server |

---

## 八、术语表

| 术语 | 定义 |
|------|------|
| MTok | Million Tokens，百万 Token |
| Reseller | 中转聚合平台（如硅基流动、OpenRouter） |
| ELO | 模型质量评分系统（OpenRouter 采用） |
| Context Length | 上下文窗口长度（tokens） |
| Free Tier | 免费额度层 |
| Capability | 模型能力（如 vision、function calling） |

---

## 九、参考链接

### 8.1 数据来源
- OpenRouter API Docs: `https://openrouter.ai/docs`
- 硅基流动定价: `https://siliconflow.cn/pricing`
- AgentDeals.dev: `https://agentdeals.dev`
- Artificial Analysis: `https://artificialanalysis.ai`

### 8.2 厂商开放平台
- OpenAI: `https://platform.openai.com/pricing`
- Anthropic: `https://console.anthropic.com`
- 百度 ERNIE: `https://qianfan.llm.yundun.cn/`
- 阿里 DashScope: `https://help.aliyun.com/zh/dashscope/`
- DeepSeek: `https://platform.deepseek.com/`

### 8.3 数据字典（核心字段）

| 字段 | 类型 | 说明 | 示例 |
|------|------|------|------|
| provider_name | string | 模型商名称 | "OpenAI" / "百度" |
| model_name | string | 模型名称 | "GPT-4o" / "ERNIE-4.0" |
| operator_name | string | 运营商名称 | "AWS Bedrock" / "硅基流动" |
| region | string | 区域代码 | "CN" / "US" / "GLOBAL" |
| currency | string | 货币 | "USD" / "CNY" |
| input_price | float | 输入价格（/MTok） | 2.5 |
| output_price | float | 输出价格（/MTok） | 10.0 |
| free_tier | text | 免费额度描述 | "每日100次，每次不超过4000 tokens" |
| context_length | int | 上下文窗口 | 128000 |
| capabilities | array | 能力列表 | ["vision","function_calling"] |

---

## 十一、数据质量与血缘

**六、数据质量与血缘**
- 数据校验规则：价格不能为负、context_length 不能超过 10M、currency 必须为 CNY/USD/EUR 之一
- 数据新鲜度指标：每条记录标注 `retrieved_at`，超过 24h 标记为 stale
- 数据血缘追踪：每条价格记录记录来源 API URL、采集批次号、采集器版本
- 质量分级：official（官方API）/ inferred（推导）/ unverified（未验证）/ stale（过期）
- 自动清洗：采集失败时保留上次成功数据，标记 "data_stale_until_next_run"
- 质量报告：每日报告包含数据质量摘要（覆盖率/新鲜度/异常数）