LLM Intelligence Hub — 产品需求文档 v0.2
文档版本:v0.3(2026年5月数据更新版)
日期:2026-05-04
负责人:宰相(AI 辅助)
状态:初稿,征询中
一、产品概述
1.1 背景
大模型市场竞争格局(2026年5月最新):
- 国内第一梯队:DeepSeek V3.2 / V4-Flash(RMB最低价)+ Kimi K2.6(首个超越GPT-5.4的开源模型)+ Qwen3.6(开源最强)+ GLM-5.1(综合)
- 海外第一梯队:xAI Grok 4.1 Fast($0.20/M,史上最便宜前沿模型)+ Claude Opus 4.6(降价67%至$5/$25)+ GPT-5系列
- 云平台:阿里云、腾讯云、百度云、华为云、火山引擎(字节)等国内平台;AWS Bedrock、Azure OpenAI、Google Cloud 等海外平台
- 中转聚合:硅基流动(SiliconFlow)、OpenRouter、Together AI、Groq、Cloudflare Workers AI 等
核心痛点:
- 模型信息极度分散——定价页、API 文档、公告分布在几十个平台
- 区域价格差异大——同一模型在中国区和国际区价格可能完全不同
- 免费政策不透明——免费额度、限流规则、区域限制缺乏统一汇总
- 中转平台价格战激烈——硅基流动、OpenRouter 等价格差异显著
- 信息更新滞后——人工维护成本高,无法实时追踪快速变化的定价
1.2 目标
建立一个覆盖全球的 LLM 情报数据库,持续追踪:
- 模型商:基础模型能力、版本迭代、发布动态
- 运营商/云平台:各区域定价、计费模式、免费额度
- 中转站:聚合 API 价格、对接稳定性、服务质量
最终输出:每日自动生成可视化报告(Web 页面),支持历史对比和趋势分析。
1.3 成功指标
| 指标 |
目标值(Phase 1) |
| 模型商覆盖率 |
国内外 20+ 主流厂商 |
| 运营商覆盖 |
30+ 云平台/中转站 |
| 模型总量 |
500+ 模型条目 |
| 更新频率 |
每日增量同步 |
| 报告生成 |
每日 08:00 自动触发 |
| 中文界面 |
100% 汉化 |
二、数据模型设计
2.1 核心实体
2.2 数据来源映射
| 数据类型 |
主要来源 |
获取方式 |
| 海外模型商 |
OpenRouter API(371 模型) |
API 自动同步 |
| 国内模型商 |
各厂商开放平台(ERNIE/Qwen/Hunyuan/Doubao 等) |
官方 API / 文档解析 |
| 云平台定价 |
AWS/Azure/阿里云/腾讯云/华为云定价页 |
官方 API / 正则解析 |
| 中转站定价 |
OpenRouter / SiliconFlow / Together AI / Groq |
API 同步 |
| 免费政策 |
各平台开发者文档 |
文档解析 + 人工补充 |
| 区域差异 |
各云平台区域定价页 |
多区域页面对比 |
三、功能需求
3.1 数据采集层(Must Have)
F1:多源数据采集
- OpenRouter API:371+ 海外模型,实时同步(定价/上下文/能力)
- 国内厂商 API:百度 Qianfan、阿里 DashScope、腾讯混元、字节火山引擎、DeepSeek、智谱 BigModel
- 中转平台:硅基流动 API、OpenRouter API(国内节点)、Together AI
- 更新策略:每日 08:00 全量同步 + 变更触发增量更新
- 错误处理:采集失败写入日志,保留上次成功数据,标记"数据待核实"
F2:模型基础信息库
- 模型名称、版本、发布商、发布时间
- 模态(文字/图片/音频/视频/代码)
- 上下文窗口、Capabilities(function calling / JSON mode / Vision)
- 模型状态(active / deprecated / discontinued)
F3:定价数据库
- 按运营商 × 模型 × 区域存储完整定价
- 支持货币自动换算(USD/CNY/EUR)
- 保留历史价格,支持趋势查看
- 标注价格数据质量(官方 / 推测 / 已过期)
F4:免费政策库
- 各平台免费模型列表
- 免费额度(每日/每月请求次数、Token 上限)
- 限流规则(QPS、并发、冷却时间)
- 区域限制(仅某地区可用、仅某用户类型可用)
- 特殊情况(限时免费、活动到期时间)
3.2 应用层(Must Have)
F5:每日自动报告生成
- 触发:每日 08:00 cron
- 内容:
- 今日新上线 / 更新的模型
- 价格变动提醒(>5% 变动高亮)
- 免费政策变更
- 场景推荐 TOP 10(编码/写作/推理/免费/低成本)
- 成本优化建议(同能力更低价格选项)
- 格式:HTML Web 页面(内网可访问)+ PDF 导出
- 分发:支持推送至钉钉群/飞书群/Email
F6:搜索与筛选
- 筛选:厂商 / 模态 / 场景 / 价格区间 / 上下文长度 / 免费/付费
- 搜索:模型名、厂商名、特性关键词
- 视图:卡片视图 / 表格视图 / 趋势图
F7:成本计算器
- 输入:Token 数量(输入/输出分开)
- 输出:各平台/运营商成本对比排行榜
- 支持按月用量估算
3.3 进阶功能(Should Have)
F8:价格变动告警
- 触发条件:价格变动 > 10%(可配置)
- 通知方式:钉钉/飞书/Email 推送
- 白名单:用户关注特定模型/平台
F9:模型评测聚合
- MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等基准分
- 按场景排名(编码/推理/写作/免费)
F10:API 接口
- JSON API 供 AI Agent 查询最优模型
- MCP Server 供 OpenClaw/Claude Code 等集成
四、覆盖范围
4.1 模型商(目标 20+)
国内厂商(目标 12 家,2026-05 实际定价)
| 厂商 |
代表模型 |
输入 CNY/MT |
输出 CNY/MT |
最新动态 |
| DeepSeek |
V3.2 / V4-Flash / R1 |
¥0.14-0.27 |
¥0.028-0.135 |
V4-Flash:全球最便宜1M context |
| 阿里 |
Qwen3-VL-32B / 8B |
¥0.18-0.20 |
¥0.60-0.68 |
Qwen3.6 开源性能逼近闭源 |
| Moonshot |
Kimi K2.6 / K2.5 |
¥0.23-0.95 |
¥0.07-0.16 |
K2.6 超越 GPT-5.4(SWE-Bench Pro) |
| 智谱 |
GLM-5.1 / GLM-4.7 |
¥0.42-1.40 |
¥0.11-0.26 |
GLM-5.1 编码能力接近 Opus 4.6 |
| MiniMax |
M2.5 |
¥0.30 |
¥0.03 |
多模态+语音,API 性价比极高 |
| 字节 |
Doubao / Step-3.5-Flash |
¥0.10+ |
— |
Step-3.5 Flash 约 GPT-4o 的 1/25 价格 |
| 百度 |
ERNIE-4.5-300B |
¥0.28 |
¥1.10 |
老牌旗舰,搜索集成 |
| 腾讯 |
Hunyuan-A13B |
¥0.14 |
¥0.57 |
腾讯系生态集成 |
| 华为 |
Pangu-4 / 3 |
企业定价 |
企业定价 |
政务/国企客户多 |
| 讯飞 |
Spark-4.0 |
企业定价 |
企业定价 |
语音交互强 |
| 零一万物 |
Yi-Large |
企业定价 |
企业定价 |
开源 Yi 系列 |
| 昆仑万维 |
Skywork-13B |
企业定价 |
企业定价 |
开源系列 |
海外厂商(目标 10 家)
| 厂商 |
代表模型 |
API 平台 |
| OpenAI |
GPT-4o / GPT-4.5 / o3 / o4 |
platform.openai.com |
| Anthropic |
Claude 3.5 Sonnet / Claude 4 |
console.anthropic.com |
| Google |
Gemini 2.0 / Gemini 1.5 |
ai.google.dev |
| Meta |
Llama 4 / Llama 3.3 |
(via Azure/单独部署) |
| xAI |
Grok-3 / Grok-4 |
x.ai |
| Mistral |
Mistral Large / Codestral |
mistral.ai |
| Cohere |
Command R+ / Command |
Cohere |
| Perplexity |
Sonar (Pro/Rtel) |
perplexity.ai |
| Amazon |
Claude/Gemini/Llama (on Bedrock) |
AWS Bedrock |
| Microsoft |
GPT-4 (on Azure) |
Azure OpenAI |
4.2 运营商/云平台(目标 30+)
国内云厂商(8 家)
| 平台 |
网址 |
主力模型 |
| 阿里云 |
aliyun.com |
Qwen / 通义全系 |
| 腾讯云 |
cloud.tencent.com |
Hunyuan 全系 |
| 百度智能云 |
cloud.baidu.com |
ERNIE 全系 |
| 华为云 |
huaweicloud.com |
Pangu 全系 |
| 火山引擎 |
volcengine.com |
Doubao 全系 |
| 京东云 |
jdcloud.com |
言犀(自研) |
| 电信天翼云 |
ctyun.cn |
(接入第三方模型) |
| 移动云 |
cmcc.cn |
(接入第三方模型) |
国内中转/聚合(5 家)
| 平台 |
网址 |
特色 |
| 硅基流动 |
siliconflow.cn |
国内最便宜中转之一 |
| OpenAI 中转 |
openai-sg.com 等 |
直连/新加坡节点 |
| DeepSeek 中转 |
多家 |
国内访问 DeepSeek |
| Azure 中转 |
多家 |
绕过 Azure 限制 |
| Claude 中转 |
多家 |
国内访问 Claude |
海外云厂商(6 家)
| 平台 |
网址 |
主力模型 |
| AWS Bedrock |
aws.amazon.com/bedrock |
Claude/Gemini/Llama/Titan |
| Azure OpenAI |
azure.microsoft.com |
GPT-4/GPT-4o |
| Google Cloud |
cloud.google.com |
Gemini/PaLM |
| Cloudflare Workers AI |
developers.cloudflare.com/workers-ai |
Llama/Gemma 等 |
| Oracle Cloud AI |
oracle.com/cloud |
Llama/Mistral |
| IBM watsonx |
ibm.com/watsonx |
Granite/Maestro |
海外中转聚合(8 家)
| 平台 |
网址 |
特色 |
| OpenRouter |
openrouter.ai |
371+ 模型,ELO 排行,免费模型多 |
| Together AI |
together.ai |
开源模型为主 |
| Groq |
console.groq.com |
高速推理(Llama/Mixtral) |
| Replicate |
replicate.com |
镜像部署,方便 |
| Anyscale |
anyscale.com |
Ray serving |
| Fireworks AI |
fireworks.ai |
高速开源模型 |
| Lepton AI |
lepton.ai |
按需计费 |
| Perplexity API |
perplexity.ai |
Sonar 模型专属 |
五、非功能需求
5.1 技术要求
- 部署:Docker 支持,内网可部署
- 数据库:PostgreSQL(主)+ TimescaleDB(时序) / SQLite(轻量版)
- 存储量:500+ 模型 × 50 字段 ≈ 100MB,每日增量 ~1MB
- 性能:报告生成 < 30 秒,API 响应 < 500ms
5.2 运维要求
- 自动更新:每日 08:00 cron 触发采集 + 报告生成
- 监控:失败告警、日志留存 30 天
- 备份:数据库每日备份
- 告警阈值:采集失败连续 3 天 / 价格变动 > 20%
5.3 数据质量
- 来源标注:每条数据标注来源 URL,可溯源
- 置信度:数据分"官方确认" / "文档推断" / "待核实"
- 更新标记:过期数据标记"已失效",保留历史
六、竞品分析摘要
| 竞品 |
覆盖 |
区域定价 |
免费政策 |
每日报告 |
中文 |
| OpenRouter |
371 模型(海外为主) |
❌ |
✅ 标记 |
❌ |
❌ |
| Artificial Analysis |
性能排行 |
❌ |
✅ 基础 |
❌ |
❌ |
| truefoundry/models |
1000+ 配置(YAML) |
❌ |
❌ |
❌ |
❌ |
| 硅基流动 |
中转聚合 |
✅ CNY |
✅ 详细 |
❌ |
✅ |
| 本文产品(目标) |
20+厂商 500+模型 |
✅ 双视图 |
✅ 详细 |
✅ 自动 |
✅ |
七、上线计划
| 阶段 |
内容 |
目标 |
工期 |
| Phase 0 |
PRD 确认 + 技术方案选定 |
1 周 |
2026-05 第1周 |
| Phase 1 |
OpenRouter 371 模型 + 10 主流国内厂商接入 + 静态报告 |
2 周 |
2026-05 第2-3周 |
| Phase 2 |
Web Dashboard + 告警 + 成本计算器 |
2 周 |
2026-05 第4周-6月第1周 |
| Phase 3 |
API 开放 + MCP Server + Agent 集成 |
1 周 |
2026-06 第2周 |
八、风险与依赖
| 风险 |
影响 |
应对 |
| 国内厂商 API 变更/限速 |
采集失败 |
多源备份 + 人工补充机制 |
| 中转平台被墙/不稳定 |
数据不可用 |
标注平台稳定性评级 |
| 价格更新太频繁 |
报告滞后 |
变更触发实时告警,不等每日同步 |
| 数据版权问题 |
合规风险 |
仅采集公开数据,标注来源 |
九、用户故事
| # |
用户 |
故事 |
| U1 |
立立(研发) |
"每天早上我花2分钟看报告,知道今天哪个模型最值得用" |
| U2 |
小龙(项目经审) |
"我想查'中文写作性价比最高的免费模型',5秒找到答案" |
| U3 |
宰相(AI 助理) |
"我想调用 API 自动为用户选择最优模型,不用每次问人" |
| U4 |
财务(成本管理) |
"我想看到本月各模型花费占比,作为预算依据" |
| U5 |
项目经审(决策者) |
"我想知道国内模型和国际模型的成本差异,辅助选型决策" |
十、附录
10.1 参考资料
- OpenRouter API:
https://openrouter.ai/api/v1/models
- 硅基流动定价:
https://siliconflow.cn/zh-stilling/price
- AWS Bedrock 定价:
https://aws.amazon.com/bedrock/pricing/
- Azure OpenAI 定价:
https://azure.microsoft.com/en-us/pricing/details/cognitive-services/openai-service/
- 百度 ERNIE:
https://qianfan.llm.yundun.cn/
- 阿里 DashScope:
https://help.aliyun.com/zh/dashscope/
- DeepSeek:
https://platform.deepseek.com/
10.2 数据字典(核心字段)
| 字段 |
类型 |
说明 |
示例 |
| provider_name |
string |
模型商名称 |
"OpenAI" / "百度" |
| model_name |
string |
模型名称 |
"GPT-4o" / "ERNIE-4.0" |
| operator_name |
string |
运营商名称 |
"AWS Bedrock" / "硅基流动" |
| region |
string |
区域代码 |
"CN" / "US" / "GLOBAL" |
| currency |
string |
货币 |
"USD" / "CNY" |
| input_price |
float |
输入价格(/MTok) |
2.5 |
| output_price |
float |
输出价格(/MTok) |
10.0 |
| free_tier |
text |
免费额度描述 |
"每日100次,每次不超过4000 tokens" |
| context_length |
int |
上下文窗口 |
128000 |
| capabilities |
array |
能力列表 |
["vision","function_calling"] |