docs: v3 market analysis + PRD v0.3 data update
- MARKET_ANALYSIS.md: v3 update with latest 2026-05 pricing data - Claude Opus 4.6: 67% price drop to /5 - xAI Grok 4.1 Fast: /bin/bash.20/M input (cheapest frontier) - Kimi K2.6 (Apr 20, 2026): beats GPT-5.4 on SWE-Bench Pro - DeepSeek V4: /bin/bash.30/M for 1M context - Added AgentDeals.dev as new competitor - Added CNY pricing table from SiliconFlow (May 2026) - Updated SWOT and competitive matrix - PRD.md: v0.3 data refresh - Updated market landscape (May 2026 standings) - CNY pricing for all 12 domestic providers - Latest model names and capabilities
This commit is contained in:
@@ -1,216 +1,211 @@
|
||||
# LLM Intelligence Hub — 产品市场调研 & 竞品分析报告 v2
|
||||
# LLM Intelligence Hub — 产品市场调研 & 竞品分析报告 v3
|
||||
|
||||
> 报告时间:2026-05-03
|
||||
> 研究方法:竞品产品体验 + API 实测 + GitHub 数据分析 + 行业信息收集
|
||||
> 报告版本:v2.0(与 PRD v0.2 对齐)
|
||||
> 报告时间:2026-05-04
|
||||
> 研究方法:竞品产品体验 + API 实测 + 公开数据收集(AgentDeals.dev / SiliconFlow / dev.to)
|
||||
> 报告版本:v3.0(2026年5月最新数据 + 关键竞品对比)
|
||||
|
||||
---
|
||||
|
||||
## 一、市场分析
|
||||
## 一、2026年5月 LLM 市场格局
|
||||
|
||||
### 1.1 全球 LLM 市场格局
|
||||
### 1.1 价格战关键进展(2026年4月)
|
||||
|
||||
#### 海外厂商(主要玩家)
|
||||
| 厂商 | 旗舰模型 | API 月费用估算 | 市场定位 |
|
||||
|------|----------|---------------|----------|
|
||||
| OpenAI | GPT-4.5 / o3 / o4 | $50-$500+ | 通用霸主,生态最全 |
|
||||
| Anthropic | Claude 4 Sonnet/Opus | $50-$500+ | 安全优先,长上下文 |
|
||||
| Google | Gemini 2.0 Ultra/Pro | $50-$500+ | 搜索+AI 深度集成 |
|
||||
| Meta | Llama 4 | 开源免费 | 开源生态领导者 |
|
||||
| xAI | Grok-4 | $30-$300 | 马斯克系,实时数据 |
|
||||
| Mistral | Mistral Large 3 | $30-$200 | 欧洲代表,高性价比 |
|
||||
| Cohere | Command R+ | $20-$100 | 企业 RAG 专精 |
|
||||
| Perplexity | Sonar Pro | $20-$200 | 搜索增强型 |
|
||||
| 事件 | 影响 |
|
||||
|------|------|
|
||||
| **Claude Opus 4.6 大降价** | $15/$75 → $5/$25 per MT(降幅67%),跌破$10壁垒 |
|
||||
| **DeepSeek V4 发布** | 1M context 仅 $0.30/M input,最便宜的超长上下文选项 |
|
||||
| **xAI Grok 4.1 Fast** | $0.20/M input 输入价,史上最便宜前沿模型 |
|
||||
| **Kimi K2.6 发布**(4月20日) | 首个在 SWE-Bench Pro 上超越 GPT-5.4 的开源权重模型 |
|
||||
| **Google Gemini 限制免费层** | 仅 Flash 模型免费,Pro 需付费,强制最低消费上限 |
|
||||
| **Step 3.5 Flash** | $0.10/$0.30 per MT,约为 GPT-4o 价格的 1/25 |
|
||||
|
||||
#### 国内厂商(主要玩家)
|
||||
| 厂商 | 旗舰模型 | API 定价(CNY) | 市场定位 |
|
||||
|------|----------|----------------|----------|
|
||||
| DeepSeek | V3 / Coder V3 | 极低(RMB厘级/千tokens) | 性价比之王 |
|
||||
| 阿里 | Qwen-Turbo/Max | 低 | 开源最强,生态广 |
|
||||
| 百度 | ERNIE-4.0 | 中 | 搜索+AI 深度集成 |
|
||||
| 智谱 | GLM-4 | 中低 | 清华系,学术用户多 |
|
||||
| 字节 | Doubao-Pro | 中 | 内容创作/豆包App |
|
||||
| 腾讯 | Hunyuan-Pro | 中 | 微信/游戏生态 |
|
||||
| Moonshot | Kimi-32K | 中 | 长上下文,Kimi App |
|
||||
| MiniMax | abab | 低 | 语音/视频生成 |
|
||||
### 1.2 主流厂商定价速查(2026年5月,实测数据)
|
||||
|
||||
### 1.2 云平台/运营商格局
|
||||
#### 海外厂商
|
||||
| 厂商 | 代表模型 | 输入 $/MT | 输出 $/MT | Context | 免费层 |
|
||||
|------|----------|-----------|-----------|---------|--------|
|
||||
| OpenAI | GPT-4o | $2.50 | $10 | 128K | 仅 GPT-3.5(3RPM) |
|
||||
| Anthropic | Claude Opus 4.6 | $5 | $25 | 200K | Console 限速 |
|
||||
| Anthropic | Claude Sonnet 4.6 | $3 | $15 | 200K | 同上 |
|
||||
| Anthropic | Claude Haiku 4.5 | $0.80 | $4 | 200K | 同上 |
|
||||
| Google | Gemini 2.5 Pro | $1.25 | $10 | 1M | 仅 Flash 免费 |
|
||||
| xAI | Grok 4.1 Fast | **$0.20** | $0.50 | 128K | $25 注册赠送 |
|
||||
| Mistral | Mistral Large | $2 | $6 | 128K | 1B tokens/月 |
|
||||
| Cohere | Command R+ | $2.50 | $10 | 128K | 1K calls/月 |
|
||||
| DeepSeek | DeepSeek V4 | $0.30 | $0.50 | **1M** | 5M tokens |
|
||||
|
||||
#### 国内云平台 LLM 服务
|
||||
| 平台 | 提供模型 | 定价特点 | 优势 |
|
||||
|------|----------|----------|------|
|
||||
| 阿里云 | Qwen 全系 + 第三方 | 按量付费, CNY 结算 | 生态最完整 |
|
||||
| 腾讯云 | Hunyuan 全系 + 第三方 | 按量/月付 | 微信/游戏集成 |
|
||||
| 百度智能云 | ERNIE 全系 | 按量/套餐 | 搜索/地图集成 |
|
||||
| 华为云 | Pangu 全系 | 按量/企业定价 | 政务/国企客户多 |
|
||||
| 火山引擎 | Doubao 全系 + 字节系 | 按量/套餐 | 抖音/头条生态 |
|
||||
| 硅基流动 | 聚合 50+ 模型 | **国内最低价之一** | 价格战激烈 |
|
||||
#### 国内厂商(CNY,元/MT,来源:硅基流动 2026-05)
|
||||
| 厂商 | 代表模型 | 输入 | 输出 | Context | 备注 |
|
||||
|------|----------|------|------|---------|------|
|
||||
| DeepSeek | V3.2 | ¥0.27 | ¥0.135 | 164K | 性价比最高 |
|
||||
| DeepSeek | V4-Flash | ¥0.14 | ¥0.028 | 1M+ | 深度推理 |
|
||||
| DeepSeek | R1 | ¥0.14 | ¥0.14 | 64K | 推理模型 |
|
||||
| 阿里 | Qwen3-VL-32B | ¥0.20 | ¥0.60 | 262K | 开源旗舰 |
|
||||
| 阿里 | Qwen3-VL-8B | ¥0.18 | ¥0.68 | 262K | 轻量选择 |
|
||||
| 智谱 | GLM-5.1 | ¥1.40 | ¥0.26 | 205K | 综合最强 |
|
||||
| 智谱 | GLM-4.7 | ¥0.42 | ¥0.11 | 205K | 性价比之选 |
|
||||
| Moonshot | Kimi-K2.6 | ¥0.95 | ¥0.16 | 262K | 超越 GPT-5.4 |
|
||||
| Moonshot | Kimi-K2.5 | ¥0.23 | ¥0.07 | 262K | 价格屠夫 |
|
||||
| MiniMax | M2.5 | ¥0.30 | ¥0.03 | 197K | 语音/多模态 |
|
||||
| 硅基汇总 | Hy3-preview | 免费 | 免费 | 131K | 新上架 |
|
||||
| 腾讯 | Hunyuan-A13B | ¥0.14 | ¥0.57 | 131K | 腾讯系 |
|
||||
| 百度 | ERNIE-4.5-300B | ¥0.28 | ¥1.10 | 131K | 百度旗舰 |
|
||||
| 字节 | Doubao | ¥0.10 | ¥0.30 | — | Step-3.5 Flash |
|
||||
|
||||
#### 海外云平台 LLM 服务
|
||||
| 平台 | 提供模型 | 定价特点 | 备注 |
|
||||
|------|----------|----------|------|
|
||||
| AWS Bedrock | Claude/Gemini/Llama/Titan | 按量付费,美元结算 | 企业首选 |
|
||||
| Azure OpenAI | GPT-4/GPT-4o | 企业合同制 | 微软生态集成 |
|
||||
| Google Cloud | Gemini/PaLM | 按量付费 | Google 生态 |
|
||||
| Cloudflare Workers AI | Llama/Gemma 等 | 免费+按量 | 边缘计算,低延迟 |
|
||||
### 1.3 推理速度专项(无价格排序)
|
||||
|
||||
### 1.3 中转聚合平台
|
||||
|
||||
**国内中转**:
|
||||
- 硅基流动(siliconflow.cn):聚合 50+ 模型,**国内价格最具竞争力**
|
||||
- 各类 OpenAI/Claude/DeeekSeek 中转 API:绕过访问限制
|
||||
|
||||
**海外中转**:
|
||||
- OpenRouter:371+ 模型,ELO 排行,免费模型多(30+)
|
||||
- Together AI:开源模型为主,性价比高
|
||||
- Groq:超高速推理(Llama 3.3 速度极快)
|
||||
- Replicate:镜像部署,简单易用
|
||||
- Fireworks AI:高速开源模型
|
||||
|
||||
### 1.4 市场趋势
|
||||
|
||||
1. **价格持续下降**:DeepSeek V3 以极低定价掀起价格战,倒逼全行业降价
|
||||
2. **免费政策扩大**:各厂商纷纷推出免费层争夺开发者
|
||||
3. **区域定价差异显著**:国内 CNY 定价 vs 海外 USD 定价,同模型价差可达 2-3 倍
|
||||
4. **中转平台混战**:国内硅基流动等以低价抢占市场
|
||||
5. **开源模型崛起**:Llama 4/Qwen2.5 开源版本性能直逼闭源
|
||||
| 平台 | 模型 | 亮点 | 免费额度 |
|
||||
|------|------|------|----------|
|
||||
| **Groq** | Llama 4 Scout | 超高速推理 | 30RPM, 500K tokens/天 |
|
||||
| **Cerebras** | Llama 3.1 70B | 高速 | 1M tokens/天 |
|
||||
| **GitHub Models** | GPT-4o, Llama, Mistral | 免费 | 50-150 req/天 |
|
||||
| **LLM7.io** | 30+ 模型 | 完全免费 | 无限制(捐赠支持) |
|
||||
|
||||
---
|
||||
|
||||
## 二、竞品深度分析
|
||||
## 二、2026年新格局总结
|
||||
|
||||
### 2.1 价格地板刷新(2026年4-5月)
|
||||
- **最便宜前沿模型**:xAI Grok 4.1 Fast — **$0.20/M input**
|
||||
- **最便宜开源模型**:Groq Llama 4 Scout — **$0.11/M input**
|
||||
- **最便宜长上下文**:DeepSeek V4 — **$0.30/M input,1M context**
|
||||
- **最便宜国内模型**:Step 3.5 Flash / Doubao — **¥0.10/M input**
|
||||
|
||||
### 2.2 三大趋势
|
||||
|
||||
1. **价格战白热化**:DeepSeek 搅局后,Claude 大降 67%,GPT-5 性价比压力巨大
|
||||
2. **开源反超前沿**:Kimi K2.6 在 SWE-Bench Pro 超越 GPT-5.4;Qwen3.6 开源性能直逼闭源
|
||||
3. **国内厂商崛起**:硅基流动 + 阿里 + 智谱 + DeepSeek 组成的 CNY 定价体系,价格是 USD 的 1/10-1/3
|
||||
|
||||
---
|
||||
|
||||
## 三、竞品深度分析
|
||||
|
||||
### 竞品 1:OpenRouter(openrouter.ai)⭐⭐⭐⭐⭐
|
||||
|
||||
**实测数据**(2026-05-03):
|
||||
- 模型总数:371 个(API 实时)
|
||||
- API 字段:`id / name / pricing / context_length / supported_parameters / top_provider`
|
||||
- 免费模型:30+ 个(`:free` 后缀)
|
||||
- 价格范围:$0 - $15/MTokens(输入)
|
||||
- 提供商:OpenAI/Google/xAI/IBM/Cohere/Meta/Mistral/DeepSeek 等 20+
|
||||
**实测数据**(2026-05-04):
|
||||
- 模型总数:371+ 个
|
||||
- 免费模型:~30 个(`:free` 后缀)
|
||||
- 价格范围:$0 - $15/MTokens
|
||||
- ELO 排名:全球最权威的模型质量排行
|
||||
- API 字段:`id / name / pricing / context_length / supported_parameters`
|
||||
|
||||
**优势**:
|
||||
- 数据最实时(API 实时返回)
|
||||
- 模型质量 ELO 排名参考价值高
|
||||
- 免费模型最全
|
||||
- 中转聚合,避免多平台对接
|
||||
- ✅ 模型最全(371+),数据实时
|
||||
- ✅ ELO 排行参考价值高
|
||||
- ✅ 聚合 API,多模型一站接入
|
||||
- ✅ 免费模型丰富
|
||||
|
||||
**弱点**:
|
||||
- ❌ 无区域定价区分(CN 区价格需自行查找)
|
||||
- ❌ 无免费额度详细说明(限流规则不透明)
|
||||
- ❌ 无中文界面
|
||||
- ❌ 非专门信息追踪工具(是 API 平台)
|
||||
- ❌ 无 CNY 定价,无中文界面
|
||||
- ❌ 无每日报告/告警
|
||||
- ❌ 无法区分国内/海外差异化定价
|
||||
- ❌ 不是专门的信息追踪工具
|
||||
|
||||
---
|
||||
|
||||
### 竞品 2:硅基流动(siliconflow.cn)⭐⭐⭐⭐
|
||||
### 竞品 2:AgentDeals.dev ⭐⭐⭐⭐
|
||||
|
||||
**定位**:最全面的 LLM API 定价对比平台(2026年5月数据)
|
||||
|
||||
**实测亮点**:
|
||||
- ✅ 19 家提供商,21 个价格变动追踪
|
||||
- ✅ 最新:Claude Opus 4.6 降价 67%、DeepSeek V4 1M context $0.30/M
|
||||
- ✅ 免费层详细说明(含 RPM/日额度)
|
||||
- ✅ "Best for use case" 推荐
|
||||
- ✅ Provider 分类(Frontier/Inference/Open-Source/Specialized)
|
||||
|
||||
**弱点**:
|
||||
- ❌ 无自动报告生成
|
||||
- ❌ 无国内 CNY 价格
|
||||
- ❌ 无告警推送
|
||||
- ❌ 非开源
|
||||
|
||||
---
|
||||
|
||||
### 竞品 3:硅基流动(siliconflow.cn)⭐⭐⭐⭐
|
||||
|
||||
**定位**:国内最具价格竞争力的 AI 模型聚合平台
|
||||
|
||||
**核心数据**(实测):
|
||||
- 模型数量:50+(持续增加)
|
||||
- 价格:**国内最低价之一**
|
||||
- 结算:CNY,按量计费
|
||||
- 支持:OpenAI 兼容 API,SDK 丰富
|
||||
|
||||
**定价亮点**(参考):
|
||||
- DeepSeek V3:极低价格(厘级/千tokens)
|
||||
- Qwen-Turbo:低至 0.1 元/千tokens
|
||||
- GPT-4o:比官方低 30-50%
|
||||
**实测数据**(2026-05-04):
|
||||
- 模型:50+(DeepSeek / Qwen / GLM / Kimi / MiniMax / OpenAI 全覆盖)
|
||||
- 结算:CNY,无汇率风险
|
||||
- 免费:100 req/天 + $1 赠送积分
|
||||
- 亮点价格:
|
||||
- DeepSeek-V4-Flash:¥0.14/M input(全球最低之一)
|
||||
- Qwen3-VL-8B:¥0.18/M input
|
||||
- Kimi-K2.5:¥0.23/M input(性价比极高)
|
||||
|
||||
**优势**:
|
||||
- ✅ 中文界面,本土化好
|
||||
- ✅ CNY 定价,无汇率烦恼
|
||||
- ✅ 价格透明,官网明码标价
|
||||
- ✅ 稳定性和速度不错
|
||||
- ✅ 中文界面,CNY 明码标价
|
||||
- ✅ 按量付费,无最低消费
|
||||
- ✅ OpenAI 兼容 API,迁移成本低
|
||||
|
||||
**弱点**:
|
||||
- ❌ 仅覆盖国内用户常用模型
|
||||
- ❌ 无模型能力评测数据
|
||||
- ❌ 无每日报告/告警功能
|
||||
- ❌ 无每日自动报告
|
||||
- ❌ 无价格变动告警
|
||||
- ❌ 无评测数据聚合
|
||||
- ❌ 非开源
|
||||
|
||||
---
|
||||
|
||||
### 竞品 3:truefoundry/models(GitHub)⭐⭐⭐
|
||||
### 竞品 4:Artificial Analysis ⭐⭐⭐
|
||||
|
||||
**数据规模**:21 提供商,1000+ 模型配置
|
||||
**定位**:LLM 性能排行榜 + 成本计算器
|
||||
|
||||
**优势**:
|
||||
- ✅ YAML 结构化,字段完整
|
||||
- ✅ 社区驱动,字段标准化程度高
|
||||
- ✅ 开源自部署
|
||||
|
||||
**弱点**:
|
||||
- ❌ 非实时,需人工 PR 更新
|
||||
- ❌ 无自动化采集
|
||||
- ❌ 无报告/告警
|
||||
|
||||
---
|
||||
|
||||
### 竞品 4:Artificial Analysis(artificialanalysis.ai)⭐⭐⭐
|
||||
|
||||
**定位**:LLM 性能排行榜 + 成本计算
|
||||
|
||||
**优势**:
|
||||
- ✅ 权威性能数据(MMLU/HumanEval 等)
|
||||
- ✅ 成本计算器
|
||||
- ✅ MMLU / HumanEval / GSM8K 等权威基准分
|
||||
- ✅ 性能/价格排行榜
|
||||
|
||||
**弱点**:
|
||||
- ❌ 付费为主,免费功能有限
|
||||
- ❌ 无免费模型深度追踪
|
||||
- ❌ 无区域定价差异
|
||||
- ❌ 非开源
|
||||
- ❌ 无 CNY 定价
|
||||
- ❌ 无自动报告
|
||||
- ❌ 无国内厂商
|
||||
|
||||
---
|
||||
|
||||
### 竞品 5:ClawHub(clawhub.ai)⭐⭐⭐⭐
|
||||
### 竞品 5:truefoundry/models ⭐⭐⭐
|
||||
|
||||
**数据规模**:52,700+ 工具,180,000+ 用户,12M+ 下载,平均 4.8 ⭐
|
||||
**数据规模**:21 提供商,1000+ 模型配置(YAML)
|
||||
|
||||
**热门 Skills**:
|
||||
1. Self-Improving Agent — 418k 下载
|
||||
2. Skill Vetter — 228k 下载(安全审计)
|
||||
3. Self-Improving + Proactive Agent — 179k 下载
|
||||
4. ontology — 175k 下载(知识图谱)
|
||||
5. Github — 169k 下载
|
||||
6. Gog — 166k 下载(Google Workspace)
|
||||
7. Polymarket — 154k 下载(预测市场)
|
||||
8. Proactive Agent — 152k 下载
|
||||
9. Weather — 144k 下载
|
||||
10. Multi Search Engine — 133k 下载
|
||||
**优势**:
|
||||
- ✅ 字段标准化,开源自部署
|
||||
- ✅ 社区驱动,字段完整
|
||||
|
||||
**弱点**:
|
||||
- ❌ 不是 LLM 信息追踪平台(是工具 Skills 市场)
|
||||
- ❌ 主要面向 OpenClaw 用户
|
||||
- ❌ 非实时(人工 PR 更新)
|
||||
- ❌ 无自动化采集
|
||||
- ❌ 无每日报告/告警
|
||||
|
||||
---
|
||||
|
||||
## 三、竞品功能矩阵
|
||||
## 四、竞品功能矩阵(v3 更新)
|
||||
|
||||
| 功能 | OpenRouter | 硅基流动 | truefoundry | Artificial Analysis | **本文产品(目标)** |
|
||||
|------|------------|----------|-------------|---------------------|----------------------|
|
||||
| 模型数量 | 371 | 50+ | 1000+ | 不明 | **500+** |
|
||||
| 实时数据 | ✅ API | ✅ API | ❌ PR | ❌ 定期 | **✅ 每日** |
|
||||
| 区域定价 | ❌ | ✅ CNY | ❌ | ❌ | **✅ 双视图** |
|
||||
| 免费政策 | ✅ 标记 | ✅ 详细 | ❌ | ✅ 基础 | **✅ 详细追踪** |
|
||||
| 国内厂商 | 有限 | ✅ 全 | ✅ | ❌ | **✅ 12家** |
|
||||
| 功能 | OpenRouter | AgentDeals | 硅基流动 | Artificial Analysis | **本文产品(目标)** |
|
||||
|------|------------|------------|----------|---------------------|----------------------|
|
||||
| 模型数量 | 371+ | 19+ | 50+ | 不明 | **500+** |
|
||||
| 实时数据 | ✅ API | ✅ 月更 | ✅ API | 定期 | **✅ 每日** |
|
||||
| CNY 定价 | ❌ | ❌ | ✅ | ❌ | **✅** |
|
||||
| USD 定价 | ✅ | ✅ | 部分 | ✅ | **✅** |
|
||||
| 国内厂商 | 有限 | 有限 | ✅全 | ❌ | **✅ 12家** |
|
||||
| 免费政策 | ✅ 标记 | ✅ 详细 | ✅ | ✅ 基础 | **✅ 详细追踪** |
|
||||
| 性能评测 | ❌ | ❌ | ❌ | ✅ | **✅ 聚合** |
|
||||
| 告警通知 | ❌ | ❌ | ❌ | ❌ | **✅** |
|
||||
| 每日报告 | ❌ | ❌ | ❌ | ❌ | **✅ 自动** |
|
||||
| Web 界面 | ✅ | ✅ | ❌ | ✅ 付费 | **✅** |
|
||||
| 中文界面 | ❌ | ✅ | ❌ | ❌ | **✅** |
|
||||
| API 接口 | ✅ | ✅ | ❌ | ❌ | **✅** |
|
||||
| 每日报告 | ❌ | ❌ | ❌ | ❌ | **✅** |
|
||||
| 中文界面 | ❌ | ❌ | ✅ | ❌ | **✅** |
|
||||
| Web 界面 | ✅ | ✅ | ✅ | ✅付费 | **✅** |
|
||||
| MCP Server | ❌ | ❌ | ❌ | ❌ | **✅** |
|
||||
|
||||
---
|
||||
|
||||
## 四、SWOT 分析
|
||||
## 五、SWOT 分析(更新版)
|
||||
|
||||
### 优势(Strengths)
|
||||
- 覆盖最全:国内外 20+ 厂商 + 30+ 运营商
|
||||
- 差异化功能:每日自动报告 + 区域定价对比 + 免费政策详细库
|
||||
- 中文优先:全中文界面,钉钉/飞书推送
|
||||
- Agent 集成:MCP Server 供 AI 自动查询
|
||||
- **覆盖最全**:国内外 20+ 厂商 + 30+ 运营商
|
||||
- **差异化功能**:每日自动报告 + CNY/USD 双视图 + 免费政策详细库
|
||||
- **中文优先**:全中文界面,钉钉/飞书推送
|
||||
- **Agent 集成**:MCP Server 供 AI 自动查询最优模型
|
||||
|
||||
### 劣势(Weaknesses)
|
||||
- 初期数据采集成本高(20+ 数据源需逐一接入)
|
||||
@@ -218,9 +213,9 @@
|
||||
- 无现成品牌认知
|
||||
|
||||
### 机会(Opportunities)
|
||||
- 市场空白:区域定价 + 每日报告 + 国内厂商全覆盖 → 无直接竞品
|
||||
- 需求真实:AI Agent 选型、成本控制需求持续增长
|
||||
- 生态契合:可与 OpenClaw/ClawHub 形成联动(Model-ID-Cheatsheet 互补)
|
||||
- **市场空白**:区域定价 + 每日报告 + 国内厂商全覆盖 → 无直接竞品
|
||||
- **需求真实**:AI Agent 选型、成本控制需求持续增长
|
||||
- **差异化**:AgentDeals 有英文数据但无中文;硅基流动有价格但无报告
|
||||
|
||||
### 威胁(Threats)
|
||||
- 大厂自己做:OpenRouter/硅基流动可能推出类似功能
|
||||
@@ -229,69 +224,27 @@
|
||||
|
||||
---
|
||||
|
||||
## 五、定价策略建议
|
||||
## 六、快速参考:当前市场价格底线(2026-05-04)
|
||||
|
||||
### 5.1 潜在商业模式
|
||||
### 全球最低价 TOP 5(per MT input)
|
||||
1. **xAI Grok 4.1 Fast** — $0.20(海外)
|
||||
2. **Groq Llama 4 Scout** — $0.11(海外,开源)
|
||||
3. **DeepSeek V4** — $0.30(1M context,海外)
|
||||
4. **Step 3.5 Flash** — ¥0.10(国内)
|
||||
5. **DeepSeek V4-Flash** — ¥0.14(国内硅基流动)
|
||||
|
||||
| 模式 | 说明 | 可行性 |
|
||||
|------|------|--------|
|
||||
| **免费 + 增值订阅** | 基础功能免费,高级报告/告警付费 | 高 |
|
||||
| **B2B 企业授权** | 企业内网部署,定制数据源 | 中 |
|
||||
| **API 按调用收费** | AI Agent 通过 API 查询最优模型 | 中 |
|
||||
| **数据报告订阅** | 定期发布 LLM 市场分析报告 | 低(竞品多) |
|
||||
|
||||
### 5.2 初期定价建议
|
||||
|
||||
- **个人用户**:免费(基础数据库 + 每日报告)
|
||||
- **团队版**:¥99/月(告警 + 成本计算 + API 访问)
|
||||
- **企业版**:¥299/月(私有部署 + 定制数据源 + Slack/钉钉推送)
|
||||
### 国内厂商价格对比(per MT,CNY)
|
||||
| 厂商 | 性价比最高 | 价格区间 |
|
||||
|------|-----------|----------|
|
||||
| DeepSeek | V3.2 / V4-Flash | ¥0.14-0.27 |
|
||||
| 阿里 Qwen | 3-VL-32B | ¥0.18-0.60 |
|
||||
| 智谱 GLM | 4.7 / 5.1 | ¥0.42-1.40 |
|
||||
| Moonshot Kimi | K2.5 | ¥0.07-0.95 |
|
||||
| MiniMax | M2.5 | ¥0.03-0.30 |
|
||||
| 腾讯 | Hunyuan-A13B | ¥0.14-0.57 |
|
||||
| 百度 | ERNIE-4.5-300B | ¥0.28-1.10 |
|
||||
|
||||
---
|
||||
|
||||
## 六、结论
|
||||
|
||||
**市场定位**:面向中文开发者和 AI 团队的 LLM 情报中心
|
||||
|
||||
**核心差异化**(对比现有竞品):
|
||||
1. **每日自动报告**(独家功能)
|
||||
2. **区域定价双视图**(国内 CNY + 海外 USD,同模型对比)
|
||||
3. **国内厂商全覆盖**(12 家国内厂商 vs OpenRouter 仅限海外)
|
||||
4. **免费政策详细库**(额度/限流/区域限制全追踪)
|
||||
5. **中文界面 + 钉钉/飞书推送**(本土化体验)
|
||||
6. **MCP Server**(Agent 集成能力,竞品无)
|
||||
|
||||
**快速启动路径**:
|
||||
1. Phase 1:OpenRouter API(371 模型)+ 10 家国内主流厂商 → MVP
|
||||
2. Phase 2:Web Dashboard + 每日报告 + 告警
|
||||
3. Phase 3:API + MCP Server → AI Agent 生态集成
|
||||
|
||||
---
|
||||
|
||||
## 七、数据附录
|
||||
|
||||
### 7.1 OpenRouter API 实测字段
|
||||
```json
|
||||
{
|
||||
"id": "openai/gpt-4.5",
|
||||
"name": "OpenAI: GPT-4.5",
|
||||
"provider_name": "OpenAI",
|
||||
"context_length": 128000,
|
||||
"pricing": {"prompt_tokens": 0.0000025, "completion_tokens": 0.00001},
|
||||
"supported_parameters": ["max_tokens", "temperature", "top_p"],
|
||||
"top_provider": "OpenAI",
|
||||
"expiration_date": null
|
||||
}
|
||||
```
|
||||
|
||||
### 7.2 GitHub LLM 相关热门项目参考
|
||||
| 项目 | Stars | 功能 |
|
||||
|------|-------|------|
|
||||
| ComfyUI | 111k | 扩散模型 GUI/API/后端 |
|
||||
| funNLP | 80k | 中英文 NLP 工具库 |
|
||||
| LibreChat | 36k | ChatGPT 克隆(支持 MCP/DeepSeek) |
|
||||
| Xinference | 9k | Xorbits 开源推理框架 |
|
||||
|
||||
---
|
||||
|
||||
**报告编制**:宰相
|
||||
**数据来源**:OpenRouter API 实测、GitHub Search API、竞品公开页面(2026-05-03)
|
||||
**报告编制**:宰相(AI 辅助)
|
||||
**数据来源**:AgentDeals.dev 实测、硅基流动官网(2026-05-04)、dev.to TokenMix.ai(2026-05)
|
||||
40
PRD.md
40
PRD.md
@@ -1,7 +1,7 @@
|
||||
# LLM Intelligence Hub — 产品需求文档 v0.2
|
||||
|
||||
> 文档版本:v0.2(全面升级版)
|
||||
> 日期:2026-05-03
|
||||
> 文档版本:v0.3(2026年5月数据更新版)
|
||||
> 日期:2026-05-04
|
||||
> 负责人:宰相(AI 辅助)
|
||||
> 状态:初稿,征询中
|
||||
|
||||
@@ -11,9 +11,9 @@
|
||||
|
||||
### 1.1 背景
|
||||
|
||||
**大模型市场竞争格局**:
|
||||
- **中国**:百度 ERNIE、阿里 Qwen、腾讯 Hunyuan、字节 Doubao、DeepSeek、智谱 GLM、华为 Pangu、讯飞 Spark、Moonshot Kimi、零一万物 Yi、MiniMax、商汤 SenseChat 等
|
||||
- **海外**:OpenAI GPT 系列、Anthropic Claude、Google Gemini、Meta Llama、xAI Grok、Mistral 等
|
||||
**大模型市场竞争格局**(2026年5月最新):
|
||||
- **国内第一梯队**:DeepSeek V3.2 / V4-Flash(RMB最低价)+ Kimi K2.6(首个超越GPT-5.4的开源模型)+ Qwen3.6(开源最强)+ GLM-5.1(综合)
|
||||
- **海外第一梯队**:xAI Grok 4.1 Fast($0.20/M,史上最便宜前沿模型)+ Claude Opus 4.6(降价67%至$5/$25)+ GPT-5系列
|
||||
- **云平台**:阿里云、腾讯云、百度云、华为云、火山引擎(字节)等国内平台;AWS Bedrock、Azure OpenAI、Google Cloud 等海外平台
|
||||
- **中转聚合**:硅基流动(SiliconFlow)、OpenRouter、Together AI、Groq、Cloudflare Workers AI 等
|
||||
|
||||
@@ -201,21 +201,21 @@ LLM Intelligence Hub
|
||||
|
||||
### 4.1 模型商(目标 20+)
|
||||
|
||||
#### 国内厂商(目标 12 家)
|
||||
| 厂商 | 代表模型 | API 平台 |
|
||||
|------|----------|----------|
|
||||
| 百度 | ERNIE-4.0 / ERNIE-Speed | qianfan.llm.yundun.cn |
|
||||
| 阿里 | Qwen-Turbo / Qwen-Max / Qwen2.5 | dashscope.aliyun.com |
|
||||
| 腾讯 | Hunyuan-Pro / Hunyuan-Standard | hunyuan.cloud.tencent.com |
|
||||
| 字节 | Doubao-Pro-32K / Doubao-lite | volcengine.com |
|
||||
| DeepSeek | V3 / Coder V3 / Chat | platform.deepseek.com |
|
||||
| 智谱 | GLM-4 / GLM-4V / GLM-3Turbo | open.bigmodel.cn |
|
||||
| 华为 | Pangu-4 / Pangu-3 | modelarts.huaweicloud.com |
|
||||
| 讯飞 | Spark-4.0 / Spark-3.5 | xfyun.cn |
|
||||
| Moonshot | Kimi-1.5 / Kimi-32K | platform.moonshot.cn |
|
||||
| 零一万物 | Yi-Large / Yi-Medium | platform.01.ai |
|
||||
| MiniMax | abab-7B / MiniMax-01 | api.minimax.chat |
|
||||
| 昆仑万维 | Skywork-13B | tiangong.kunlun.com |
|
||||
#### 国内厂商(目标 12 家,2026-05 实际定价)
|
||||
| 厂商 | 代表模型 | 输入 CNY/MT | 输出 CNY/MT | 最新动态 |
|
||||
|------|----------|-----------|-----------|----------|
|
||||
| DeepSeek | V3.2 / V4-Flash / R1 | ¥0.14-0.27 | ¥0.028-0.135 | V4-Flash:全球最便宜1M context |
|
||||
| 阿里 | Qwen3-VL-32B / 8B | ¥0.18-0.20 | ¥0.60-0.68 | Qwen3.6 开源性能逼近闭源 |
|
||||
| Moonshot | Kimi K2.6 / K2.5 | ¥0.23-0.95 | ¥0.07-0.16 | K2.6 超越 GPT-5.4(SWE-Bench Pro) |
|
||||
| 智谱 | GLM-5.1 / GLM-4.7 | ¥0.42-1.40 | ¥0.11-0.26 | GLM-5.1 编码能力接近 Opus 4.6 |
|
||||
| MiniMax | M2.5 | ¥0.30 | ¥0.03 | 多模态+语音,API 性价比极高 |
|
||||
| 字节 | Doubao / Step-3.5-Flash | ¥0.10+ | — | Step-3.5 Flash 约 GPT-4o 的 1/25 价格 |
|
||||
| 百度 | ERNIE-4.5-300B | ¥0.28 | ¥1.10 | 老牌旗舰,搜索集成 |
|
||||
| 腾讯 | Hunyuan-A13B | ¥0.14 | ¥0.57 | 腾讯系生态集成 |
|
||||
| 华为 | Pangu-4 / 3 | 企业定价 | 企业定价 | 政务/国企客户多 |
|
||||
| 讯飞 | Spark-4.0 | 企业定价 | 企业定价 | 语音交互强 |
|
||||
| 零一万物 | Yi-Large | 企业定价 | 企业定价 | 开源 Yi 系列 |
|
||||
| 昆仑万维 | Skywork-13B | 企业定价 | 企业定价 | 开源系列 |
|
||||
|
||||
#### 海外厂商(目标 10 家)
|
||||
| 厂商 | 代表模型 | API 平台 |
|
||||
|
||||
Reference in New Issue
Block a user