Files

Your Name dbdf13ea42 docs: v3 market analysis + PRD v0.3 data update

- MARKET_ANALYSIS.md: v3 update with latest 2026-05 pricing data
  - Claude Opus 4.6: 67% price drop to /5
  - xAI Grok 4.1 Fast: /bin/bash.20/M input (cheapest frontier)
  - Kimi K2.6 (Apr 20, 2026): beats GPT-5.4 on SWE-Bench Pro
  - DeepSeek V4: /bin/bash.30/M for 1M context
  - Added AgentDeals.dev as new competitor
  - Added CNY pricing table from SiliconFlow (May 2026)
  - Updated SWOT and competitive matrix

- PRD.md: v0.3 data refresh
  - Updated market landscape (May 2026 standings)
  - CNY pricing for all 12 domestic providers
  - Latest model names and capabilities

2026-05-04 09:09:40 +08:00

16 KiB

Raw Blame History

LLM Intelligence Hub — 产品需求文档 v0.2

文档版本：v0.3（2026年5月数据更新版）日期：2026-05-04 负责人：宰相（AI 辅助）状态：初稿，征询中

一、产品概述

1.1 背景

大模型市场竞争格局（2026年5月最新）：

国内第一梯队：DeepSeek V3.2 / V4-Flash（RMB最低价）+ Kimi K2.6（首个超越GPT-5.4的开源模型）+ Qwen3.6（开源最强）+ GLM-5.1（综合）
海外第一梯队：xAI Grok 4.1 Fast（$0.20/M，史上最便宜前沿模型）+ Claude Opus 4.6（降价67%至$5/$25）+ GPT-5系列
云平台：阿里云、腾讯云、百度云、华为云、火山引擎（字节）等国内平台；AWS Bedrock、Azure OpenAI、Google Cloud 等海外平台
中转聚合：硅基流动（SiliconFlow）、OpenRouter、Together AI、Groq、Cloudflare Workers AI 等

核心痛点：

模型信息极度分散——定价页、API 文档、公告分布在几十个平台
区域价格差异大——同一模型在中国区和国际区价格可能完全不同
免费政策不透明——免费额度、限流规则、区域限制缺乏统一汇总
中转平台价格战激烈——硅基流动、OpenRouter 等价格差异显著
信息更新滞后——人工维护成本高，无法实时追踪快速变化的定价

1.2 目标

建立一个覆盖全球的 LLM 情报数据库，持续追踪：

模型商：基础模型能力、版本迭代、发布动态
运营商/云平台：各区域定价、计费模式、免费额度
中转站：聚合 API 价格、对接稳定性、服务质量

最终输出：每日自动生成可视化报告（Web 页面），支持历史对比和趋势分析。

1.3 成功指标

指标	目标值（Phase 1）
模型商覆盖率	国内外 20+ 主流厂商
运营商覆盖	30+ 云平台/中转站
模型总量	500+ 模型条目
更新频率	每日增量同步
报告生成	每日 08:00 自动触发
中文界面	100% 汉化

二、数据模型设计

2.1 核心实体

LLM Intelligence Hub
│
├── ModelProvider（模型商）
│   ├── name（名称）: "OpenAI" / "百度" / "DeepSeek"
│   ├── country（国籍）: "US" / "CN" / "EU"
│   ├── website: 官网
│   ├── founded: 成立时间
│   └── models[] → Model（下属模型列表）
│
├── Model（模型）
│   ├── id: 全局唯一标识
│   ├── provider_id → ModelProvider
│   ├── name: "GPT-4o" / "ERNIE-4.0" / "Qwen-72B"
│   ├── version: 版本号（如 "2025-12"）
│   ├── modality（模态）: text / vision / audio / video / code
│   ├── context_length: 上下文窗口（tokens）
│   ├── capabilities[]: ["function_calling", "json_mode", "vision"]
│   ├── release_date: 发布时间
│   ├── status: active / deprecated / discontinued
│   └── parent_model（父模型）: 用于区分 Turbo/Lite 等变体
│
├── Operator（运营商/云平台）
│   ├── name: "阿里云" / "AWS" / "硅基流动"
│   ├── type: "cloud"（云厂商）/ "reseller"（中转）/ "official"（官方直销）
│   ├── country: 运营主体国籍
│   ├── website: 控制台地址
│   ├── api_endpoint: API 地址
│   ├── auth_type: "api_key" / "oauth" / "STS"
│   └── region_pricing[] → RegionPricing（各区域定价）
│
├── RegionPricing（区域定价）
│   ├── id
│   ├── operator_id → Operator
│   ├── model_id → Model（哪个模型在此平台有售）
│   ├── region: "CN" / "US" / "EU" / "GLOBAL"
│   ├── currency: "CNY" / "USD" / "EUR"
│   ├── input_price_per_mtok: 输入价格（元/百万 Token）
│   ├── output_price_per_mtok: 输出价格
│   ├── free_tier（免费层）: 描述免费额度
│   ├── free_limitations[]: ["每日限100次", "仅限国内IP"]
│   ├── rate_limit: 限流规则
│   ├── last_updated: 最后更新
│   └── source_url: 价格页/文档链接
│
├── PricingChange（价格变动记录）
│   ├── id
│   ├── model_id → Model
│   ├── operator_id → Operator
│   ├── region
│   ├── old_price / new_price
│   ├── change_date
│   └── change_type: increase / decrease / new_model / discontinued
│
└── DailyReport（每日报告）
    ├── id
    ├── report_date
    ├── new_models[]: 今日新上线模型
    ├── price_changes[]: 价格变动
    ├── free_policy_changes[]: 免费政策变更
    ├── top_recommendations{}: 场景推荐
    └── html_content: Web 报告内容

2.2 数据来源映射

数据类型	主要来源	获取方式
海外模型商	OpenRouter API（371 模型）	API 自动同步
国内模型商	各厂商开放平台（ERNIE/Qwen/Hunyuan/Doubao 等）	官方 API / 文档解析
云平台定价	AWS/Azure/阿里云/腾讯云/华为云定价页	官方 API / 正则解析
中转站定价	OpenRouter / SiliconFlow / Together AI / Groq	API 同步
免费政策	各平台开发者文档	文档解析 + 人工补充
区域差异	各云平台区域定价页	多区域页面对比

三、功能需求

3.1 数据采集层（Must Have）

F1：多源数据采集

OpenRouter API：371+ 海外模型，实时同步（定价/上下文/能力）
国内厂商 API：百度 Qianfan、阿里 DashScope、腾讯混元、字节火山引擎、DeepSeek、智谱 BigModel
中转平台：硅基流动 API、OpenRouter API（国内节点）、Together AI
更新策略：每日 08:00 全量同步 + 变更触发增量更新
错误处理：采集失败写入日志，保留上次成功数据，标记"数据待核实"

F2：模型基础信息库

模型名称、版本、发布商、发布时间
模态（文字/图片/音频/视频/代码）
上下文窗口、Capabilities（function calling / JSON mode / Vision）
模型状态（active / deprecated / discontinued）

F3：定价数据库

按运营商 × 模型 × 区域存储完整定价
支持货币自动换算（USD/CNY/EUR）
保留历史价格，支持趋势查看
标注价格数据质量（官方 / 推测 / 已过期）

F4：免费政策库

各平台免费模型列表
免费额度（每日/每月请求次数、Token 上限）
限流规则（QPS、并发、冷却时间）
区域限制（仅某地区可用、仅某用户类型可用）
特殊情况（限时免费、活动到期时间）

3.2 应用层（Must Have）

F5：每日自动报告生成

触发：每日 08:00 cron
内容：
1. 今日新上线 / 更新的模型
2. 价格变动提醒（>5% 变动高亮）
3. 免费政策变更
4. 场景推荐 TOP 10（编码/写作/推理/免费/低成本）
5. 成本优化建议（同能力更低价格选项）
格式：HTML Web 页面（内网可访问）+ PDF 导出
分发：支持推送至钉钉群/飞书群/Email

F6：搜索与筛选

筛选：厂商 / 模态 / 场景 / 价格区间 / 上下文长度 / 免费/付费
搜索：模型名、厂商名、特性关键词
视图：卡片视图 / 表格视图 / 趋势图

F7：成本计算器

输入：Token 数量（输入/输出分开）
输出：各平台/运营商成本对比排行榜
支持按月用量估算

3.3 进阶功能（Should Have）

F8：价格变动告警

触发条件：价格变动 > 10%（可配置）
通知方式：钉钉/飞书/Email 推送
白名单：用户关注特定模型/平台

F9：模型评测聚合

MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等基准分
按场景排名（编码/推理/写作/免费）

F10：API 接口

JSON API 供 AI Agent 查询最优模型
MCP Server 供 OpenClaw/Claude Code 等集成

四、覆盖范围

4.1 模型商（目标 20+）

国内厂商（目标 12 家，2026-05 实际定价）

厂商	代表模型	输入 CNY/MT	输出 CNY/MT	最新动态
DeepSeek	V3.2 / V4-Flash / R1	¥0.14-0.27	¥0.028-0.135	V4-Flash：全球最便宜1M context
阿里	Qwen3-VL-32B / 8B	¥0.18-0.20	¥0.60-0.68	Qwen3.6 开源性能逼近闭源
Moonshot	Kimi K2.6 / K2.5	¥0.23-0.95	¥0.07-0.16	K2.6 超越 GPT-5.4（SWE-Bench Pro）
智谱	GLM-5.1 / GLM-4.7	¥0.42-1.40	¥0.11-0.26	GLM-5.1 编码能力接近 Opus 4.6
MiniMax	M2.5	¥0.30	¥0.03	多模态+语音，API 性价比极高
字节	Doubao / Step-3.5-Flash	¥0.10+	—	Step-3.5 Flash 约 GPT-4o 的 1/25 价格
百度	ERNIE-4.5-300B	¥0.28	¥1.10	老牌旗舰，搜索集成
腾讯	Hunyuan-A13B	¥0.14	¥0.57	腾讯系生态集成
华为	Pangu-4 / 3	企业定价	企业定价	政务/国企客户多
讯飞	Spark-4.0	企业定价	企业定价	语音交互强
零一万物	Yi-Large	企业定价	企业定价	开源 Yi 系列
昆仑万维	Skywork-13B	企业定价	企业定价	开源系列

海外厂商（目标 10 家）

厂商	代表模型	API 平台
OpenAI	GPT-4o / GPT-4.5 / o3 / o4	platform.openai.com
Anthropic	Claude 3.5 Sonnet / Claude 4	console.anthropic.com
Google	Gemini 2.0 / Gemini 1.5	ai.google.dev
Meta	Llama 4 / Llama 3.3	(via Azure/单独部署)
xAI	Grok-3 / Grok-4	x.ai
Mistral	Mistral Large / Codestral	mistral.ai
Cohere	Command R+ / Command	Cohere
Perplexity	Sonar (Pro/Rtel)	perplexity.ai
Amazon	Claude/Gemini/Llama (on Bedrock)	AWS Bedrock
Microsoft	GPT-4 (on Azure)	Azure OpenAI

4.2 运营商/云平台（目标 30+）

国内云厂商（8 家）

平台	网址	主力模型
阿里云	aliyun.com	Qwen / 通义全系
腾讯云	cloud.tencent.com	Hunyuan 全系
百度智能云	cloud.baidu.com	ERNIE 全系
华为云	huaweicloud.com	Pangu 全系
火山引擎	volcengine.com	Doubao 全系
京东云	jdcloud.com	言犀（自研）
电信天翼云	ctyun.cn	（接入第三方模型）
移动云	cmcc.cn	（接入第三方模型）

国内中转/聚合（5 家）

平台	网址	特色
硅基流动	siliconflow.cn	国内最便宜中转之一
OpenAI 中转	openai-sg.com 等	直连/新加坡节点
DeepSeek 中转	多家	国内访问 DeepSeek
Azure 中转	多家	绕过 Azure 限制
Claude 中转	多家	国内访问 Claude

海外云厂商（6 家）

平台	网址	主力模型
AWS Bedrock	aws.amazon.com/bedrock	Claude/Gemini/Llama/Titan
Azure OpenAI	azure.microsoft.com	GPT-4/GPT-4o
Google Cloud	cloud.google.com	Gemini/PaLM
Cloudflare Workers AI	developers.cloudflare.com/workers-ai	Llama/Gemma 等
Oracle Cloud AI	oracle.com/cloud	Llama/Mistral
IBM watsonx	ibm.com/watsonx	Granite/Maestro

海外中转聚合（8 家）

平台	网址	特色
OpenRouter	openrouter.ai	371+ 模型，ELO 排行，免费模型多
Together AI	together.ai	开源模型为主
Groq	console.groq.com	高速推理（Llama/Mixtral）
Replicate	replicate.com	镜像部署，方便
Anyscale	anyscale.com	Ray serving
Fireworks AI	fireworks.ai	高速开源模型
Lepton AI	lepton.ai	按需计费
Perplexity API	perplexity.ai	Sonar 模型专属

五、非功能需求

5.1 技术要求

部署：Docker 支持，内网可部署
数据库：PostgreSQL（主）+ TimescaleDB（时序） / SQLite（轻量版）
存储量：500+ 模型 × 50 字段 ≈ 100MB，每日增量 ~1MB
性能：报告生成 < 30 秒，API 响应 < 500ms

5.2 运维要求

自动更新：每日 08:00 cron 触发采集 + 报告生成
监控：失败告警、日志留存 30 天
备份：数据库每日备份
告警阈值：采集失败连续 3 天 / 价格变动 > 20%

5.3 数据质量

来源标注：每条数据标注来源 URL，可溯源
置信度：数据分"官方确认" / "文档推断" / "待核实"
更新标记：过期数据标记"已失效"，保留历史

六、竞品分析摘要

竞品	覆盖	区域定价	免费政策	每日报告	中文
OpenRouter	371 模型（海外为主）	❌	✅ 标记	❌	❌
Artificial Analysis	性能排行	❌	✅ 基础	❌	❌
truefoundry/models	1000+ 配置（YAML）	❌	❌	❌	❌
硅基流动	中转聚合	✅ CNY	✅ 详细	❌	✅
本文产品（目标）	20+厂商 500+模型	✅ 双视图	✅ 详细	✅ 自动	✅

七、上线计划

阶段	内容	目标	工期
Phase 0	PRD 确认 + 技术方案选定	1 周	2026-05 第1周
Phase 1	OpenRouter 371 模型 + 10 主流国内厂商接入 + 静态报告	2 周	2026-05 第2-3周
Phase 2	Web Dashboard + 告警 + 成本计算器	2 周	2026-05 第4周-6月第1周
Phase 3	API 开放 + MCP Server + Agent 集成	1 周	2026-06 第2周

八、风险与依赖

风险	影响	应对
国内厂商 API 变更/限速	采集失败	多源备份 + 人工补充机制
中转平台被墙/不稳定	数据不可用	标注平台稳定性评级
价格更新太频繁	报告滞后	变更触发实时告警，不等每日同步
数据版权问题	合规风险	仅采集公开数据，标注来源

九、用户故事

#	用户	故事
U1	立立（研发）	"每天早上我花2分钟看报告，知道今天哪个模型最值得用"
U2	小龙（项目经审）	"我想查'中文写作性价比最高的免费模型'，5秒找到答案"
U3	宰相（AI 助理）	"我想调用 API 自动为用户选择最优模型，不用每次问人"
U4	财务（成本管理）	"我想看到本月各模型花费占比，作为预算依据"
U5	项目经审（决策者）	"我想知道国内模型和国际模型的成本差异，辅助选型决策"

十、附录

10.1 参考资料

OpenRouter API: https://openrouter.ai/api/v1/models
硅基流动定价: https://siliconflow.cn/zh-stilling/price
AWS Bedrock 定价: https://aws.amazon.com/bedrock/pricing/
Azure OpenAI 定价: https://azure.microsoft.com/en-us/pricing/details/cognitive-services/openai-service/
百度 ERNIE: https://qianfan.llm.yundun.cn/
阿里 DashScope: https://help.aliyun.com/zh/dashscope/
DeepSeek: https://platform.deepseek.com/

10.2 数据字典（核心字段）

字段	类型	说明	示例
provider_name	string	模型商名称	"OpenAI" / "百度"
model_name	string	模型名称	"GPT-4o" / "ERNIE-4.0"
operator_name	string	运营商名称	"AWS Bedrock" / "硅基流动"
region	string	区域代码	"CN" / "US" / "GLOBAL"
currency	string	货币	"USD" / "CNY"
input_price	float	输入价格（/MTok）	2.5
output_price	float	输出价格（/MTok）	10.0
free_tier	text	免费额度描述	"每日100次，每次不超过4000 tokens"
context_length	int	上下文窗口	128000
capabilities	array	能力列表	["vision","function_calling"]

16 KiB Raw Blame History Unescape Escape

LLM Intelligence Hub — 产品需求文档 v0.2

一、产品概述

1.1 背景

1.2 目标

1.3 成功指标

二、数据模型设计

2.1 核心实体

2.2 数据来源映射

三、功能需求

3.1 数据采集层（Must Have）

F1：多源数据采集

F2：模型基础信息库

F3：定价数据库

F4：免费政策库

3.2 应用层（Must Have）

F5：每日自动报告生成

F6：搜索与筛选

F7：成本计算器

3.3 进阶功能（Should Have）

F8：价格变动告警

F9：模型评测聚合

F10：API 接口

四、覆盖范围

4.1 模型商（目标 20+）

国内厂商（目标 12 家，2026-05 实际定价）

海外厂商（目标 10 家）

4.2 运营商/云平台（目标 30+）

国内云厂商（8 家）

国内中转/聚合（5 家）

海外云厂商（6 家）

海外中转聚合（8 家）

五、非功能需求

5.1 技术要求

5.2 运维要求

5.3 数据质量

六、竞品分析摘要

七、上线计划

八、风险与依赖

九、用户故事

十、附录

10.1 参考资料

10.2 数据字典（核心字段）

16 KiB

Raw Blame History