From dbdf13ea4284c69826077ff039e6f055cd0091b6 Mon Sep 17 00:00:00 2001 From: Your Name Date: Mon, 4 May 2026 09:09:40 +0800 Subject: [PATCH] docs: v3 market analysis + PRD v0.3 data update - MARKET_ANALYSIS.md: v3 update with latest 2026-05 pricing data - Claude Opus 4.6: 67% price drop to /5 - xAI Grok 4.1 Fast: /bin/bash.20/M input (cheapest frontier) - Kimi K2.6 (Apr 20, 2026): beats GPT-5.4 on SWE-Bench Pro - DeepSeek V4: /bin/bash.30/M for 1M context - Added AgentDeals.dev as new competitor - Added CNY pricing table from SiliconFlow (May 2026) - Updated SWOT and competitive matrix - PRD.md: v0.3 data refresh - Updated market landscape (May 2026 standings) - CNY pricing for all 12 domestic providers - Latest model names and capabilities --- MARKET_ANALYSIS.md | 387 ++++++++++++++++++++------------------------- PRD.md | 40 ++--- 2 files changed, 190 insertions(+), 237 deletions(-) diff --git a/MARKET_ANALYSIS.md b/MARKET_ANALYSIS.md index 2f4268e..bcf9502 100644 --- a/MARKET_ANALYSIS.md +++ b/MARKET_ANALYSIS.md @@ -1,216 +1,211 @@ -# LLM Intelligence Hub — 产品市场调研 & 竞品分析报告 v2 +# LLM Intelligence Hub — 产品市场调研 & 竞品分析报告 v3 -> 报告时间:2026-05-03 -> 研究方法:竞品产品体验 + API 实测 + GitHub 数据分析 + 行业信息收集 -> 报告版本:v2.0(与 PRD v0.2 对齐) +> 报告时间:2026-05-04 +> 研究方法:竞品产品体验 + API 实测 + 公开数据收集(AgentDeals.dev / SiliconFlow / dev.to) +> 报告版本:v3.0(2026年5月最新数据 + 关键竞品对比) --- -## 一、市场分析 +## 一、2026年5月 LLM 市场格局 -### 1.1 全球 LLM 市场格局 +### 1.1 价格战关键进展(2026年4月) -#### 海外厂商(主要玩家) -| 厂商 | 旗舰模型 | API 月费用估算 | 市场定位 | -|------|----------|---------------|----------| -| OpenAI | GPT-4.5 / o3 / o4 | $50-$500+ | 通用霸主,生态最全 | -| Anthropic | Claude 4 Sonnet/Opus | $50-$500+ | 安全优先,长上下文 | -| Google | Gemini 2.0 Ultra/Pro | $50-$500+ | 搜索+AI 深度集成 | -| Meta | Llama 4 | 开源免费 | 开源生态领导者 | -| xAI | Grok-4 | $30-$300 | 马斯克系,实时数据 | -| Mistral | Mistral Large 3 | $30-$200 | 欧洲代表,高性价比 | -| Cohere | Command R+ | $20-$100 | 企业 RAG 专精 | -| Perplexity | Sonar Pro | $20-$200 | 搜索增强型 | +| 事件 | 影响 | +|------|------| +| **Claude Opus 4.6 大降价** | $15/$75 → $5/$25 per MT(降幅67%),跌破$10壁垒 | +| **DeepSeek V4 发布** | 1M context 仅 $0.30/M input,最便宜的超长上下文选项 | +| **xAI Grok 4.1 Fast** | $0.20/M input 输入价,史上最便宜前沿模型 | +| **Kimi K2.6 发布**(4月20日) | 首个在 SWE-Bench Pro 上超越 GPT-5.4 的开源权重模型 | +| **Google Gemini 限制免费层** | 仅 Flash 模型免费,Pro 需付费,强制最低消费上限 | +| **Step 3.5 Flash** | $0.10/$0.30 per MT,约为 GPT-4o 价格的 1/25 | -#### 国内厂商(主要玩家) -| 厂商 | 旗舰模型 | API 定价(CNY) | 市场定位 | -|------|----------|----------------|----------| -| DeepSeek | V3 / Coder V3 | 极低(RMB厘级/千tokens) | 性价比之王 | -| 阿里 | Qwen-Turbo/Max | 低 | 开源最强,生态广 | -| 百度 | ERNIE-4.0 | 中 | 搜索+AI 深度集成 | -| 智谱 | GLM-4 | 中低 | 清华系,学术用户多 | -| 字节 | Doubao-Pro | 中 | 内容创作/豆包App | -| 腾讯 | Hunyuan-Pro | 中 | 微信/游戏生态 | -| Moonshot | Kimi-32K | 中 | 长上下文,Kimi App | -| MiniMax | abab | 低 | 语音/视频生成 | +### 1.2 主流厂商定价速查(2026年5月,实测数据) -### 1.2 云平台/运营商格局 +#### 海外厂商 +| 厂商 | 代表模型 | 输入 $/MT | 输出 $/MT | Context | 免费层 | +|------|----------|-----------|-----------|---------|--------| +| OpenAI | GPT-4o | $2.50 | $10 | 128K | 仅 GPT-3.5(3RPM) | +| Anthropic | Claude Opus 4.6 | $5 | $25 | 200K | Console 限速 | +| Anthropic | Claude Sonnet 4.6 | $3 | $15 | 200K | 同上 | +| Anthropic | Claude Haiku 4.5 | $0.80 | $4 | 200K | 同上 | +| Google | Gemini 2.5 Pro | $1.25 | $10 | 1M | 仅 Flash 免费 | +| xAI | Grok 4.1 Fast | **$0.20** | $0.50 | 128K | $25 注册赠送 | +| Mistral | Mistral Large | $2 | $6 | 128K | 1B tokens/月 | +| Cohere | Command R+ | $2.50 | $10 | 128K | 1K calls/月 | +| DeepSeek | DeepSeek V4 | $0.30 | $0.50 | **1M** | 5M tokens | -#### 国内云平台 LLM 服务 -| 平台 | 提供模型 | 定价特点 | 优势 | -|------|----------|----------|------| -| 阿里云 | Qwen 全系 + 第三方 | 按量付费, CNY 结算 | 生态最完整 | -| 腾讯云 | Hunyuan 全系 + 第三方 | 按量/月付 | 微信/游戏集成 | -| 百度智能云 | ERNIE 全系 | 按量/套餐 | 搜索/地图集成 | -| 华为云 | Pangu 全系 | 按量/企业定价 | 政务/国企客户多 | -| 火山引擎 | Doubao 全系 + 字节系 | 按量/套餐 | 抖音/头条生态 | -| 硅基流动 | 聚合 50+ 模型 | **国内最低价之一** | 价格战激烈 | +#### 国内厂商(CNY,元/MT,来源:硅基流动 2026-05) +| 厂商 | 代表模型 | 输入 | 输出 | Context | 备注 | +|------|----------|------|------|---------|------| +| DeepSeek | V3.2 | ¥0.27 | ¥0.135 | 164K | 性价比最高 | +| DeepSeek | V4-Flash | ¥0.14 | ¥0.028 | 1M+ | 深度推理 | +| DeepSeek | R1 | ¥0.14 | ¥0.14 | 64K | 推理模型 | +| 阿里 | Qwen3-VL-32B | ¥0.20 | ¥0.60 | 262K | 开源旗舰 | +| 阿里 | Qwen3-VL-8B | ¥0.18 | ¥0.68 | 262K | 轻量选择 | +| 智谱 | GLM-5.1 | ¥1.40 | ¥0.26 | 205K | 综合最强 | +| 智谱 | GLM-4.7 | ¥0.42 | ¥0.11 | 205K | 性价比之选 | +| Moonshot | Kimi-K2.6 | ¥0.95 | ¥0.16 | 262K | 超越 GPT-5.4 | +| Moonshot | Kimi-K2.5 | ¥0.23 | ¥0.07 | 262K | 价格屠夫 | +| MiniMax | M2.5 | ¥0.30 | ¥0.03 | 197K | 语音/多模态 | +| 硅基汇总 | Hy3-preview | 免费 | 免费 | 131K | 新上架 | +| 腾讯 | Hunyuan-A13B | ¥0.14 | ¥0.57 | 131K | 腾讯系 | +| 百度 | ERNIE-4.5-300B | ¥0.28 | ¥1.10 | 131K | 百度旗舰 | +| 字节 | Doubao | ¥0.10 | ¥0.30 | — | Step-3.5 Flash | -#### 海外云平台 LLM 服务 -| 平台 | 提供模型 | 定价特点 | 备注 | -|------|----------|----------|------| -| AWS Bedrock | Claude/Gemini/Llama/Titan | 按量付费,美元结算 | 企业首选 | -| Azure OpenAI | GPT-4/GPT-4o | 企业合同制 | 微软生态集成 | -| Google Cloud | Gemini/PaLM | 按量付费 | Google 生态 | -| Cloudflare Workers AI | Llama/Gemma 等 | 免费+按量 | 边缘计算,低延迟 | +### 1.3 推理速度专项(无价格排序) -### 1.3 中转聚合平台 - -**国内中转**: -- 硅基流动(siliconflow.cn):聚合 50+ 模型,**国内价格最具竞争力** -- 各类 OpenAI/Claude/DeeekSeek 中转 API:绕过访问限制 - -**海外中转**: -- OpenRouter:371+ 模型,ELO 排行,免费模型多(30+) -- Together AI:开源模型为主,性价比高 -- Groq:超高速推理(Llama 3.3 速度极快) -- Replicate:镜像部署,简单易用 -- Fireworks AI:高速开源模型 - -### 1.4 市场趋势 - -1. **价格持续下降**:DeepSeek V3 以极低定价掀起价格战,倒逼全行业降价 -2. **免费政策扩大**:各厂商纷纷推出免费层争夺开发者 -3. **区域定价差异显著**:国内 CNY 定价 vs 海外 USD 定价,同模型价差可达 2-3 倍 -4. **中转平台混战**:国内硅基流动等以低价抢占市场 -5. **开源模型崛起**:Llama 4/Qwen2.5 开源版本性能直逼闭源 +| 平台 | 模型 | 亮点 | 免费额度 | +|------|------|------|----------| +| **Groq** | Llama 4 Scout | 超高速推理 | 30RPM, 500K tokens/天 | +| **Cerebras** | Llama 3.1 70B | 高速 | 1M tokens/天 | +| **GitHub Models** | GPT-4o, Llama, Mistral | 免费 | 50-150 req/天 | +| **LLM7.io** | 30+ 模型 | 完全免费 | 无限制(捐赠支持) | --- -## 二、竞品深度分析 +## 二、2026年新格局总结 + +### 2.1 价格地板刷新(2026年4-5月) +- **最便宜前沿模型**:xAI Grok 4.1 Fast — **$0.20/M input** +- **最便宜开源模型**:Groq Llama 4 Scout — **$0.11/M input** +- **最便宜长上下文**:DeepSeek V4 — **$0.30/M input,1M context** +- **最便宜国内模型**:Step 3.5 Flash / Doubao — **¥0.10/M input** + +### 2.2 三大趋势 + +1. **价格战白热化**:DeepSeek 搅局后,Claude 大降 67%,GPT-5 性价比压力巨大 +2. **开源反超前沿**:Kimi K2.6 在 SWE-Bench Pro 超越 GPT-5.4;Qwen3.6 开源性能直逼闭源 +3. **国内厂商崛起**:硅基流动 + 阿里 + 智谱 + DeepSeek 组成的 CNY 定价体系,价格是 USD 的 1/10-1/3 + +--- + +## 三、竞品深度分析 ### 竞品 1:OpenRouter(openrouter.ai)⭐⭐⭐⭐⭐ -**实测数据**(2026-05-03): -- 模型总数:371 个(API 实时) -- API 字段:`id / name / pricing / context_length / supported_parameters / top_provider` -- 免费模型:30+ 个(`:free` 后缀) -- 价格范围:$0 - $15/MTokens(输入) -- 提供商:OpenAI/Google/xAI/IBM/Cohere/Meta/Mistral/DeepSeek 等 20+ +**实测数据**(2026-05-04): +- 模型总数:371+ 个 +- 免费模型:~30 个(`:free` 后缀) +- 价格范围:$0 - $15/MTokens +- ELO 排名:全球最权威的模型质量排行 +- API 字段:`id / name / pricing / context_length / supported_parameters` **优势**: -- 数据最实时(API 实时返回) -- 模型质量 ELO 排名参考价值高 -- 免费模型最全 -- 中转聚合,避免多平台对接 +- ✅ 模型最全(371+),数据实时 +- ✅ ELO 排行参考价值高 +- ✅ 聚合 API,多模型一站接入 +- ✅ 免费模型丰富 **弱点**: -- ❌ 无区域定价区分(CN 区价格需自行查找) -- ❌ 无免费额度详细说明(限流规则不透明) -- ❌ 无中文界面 -- ❌ 非专门信息追踪工具(是 API 平台) +- ❌ 无 CNY 定价,无中文界面 +- ❌ 无每日报告/告警 +- ❌ 无法区分国内/海外差异化定价 +- ❌ 不是专门的信息追踪工具 --- -### 竞品 2:硅基流动(siliconflow.cn)⭐⭐⭐⭐ +### 竞品 2:AgentDeals.dev ⭐⭐⭐⭐ + +**定位**:最全面的 LLM API 定价对比平台(2026年5月数据) + +**实测亮点**: +- ✅ 19 家提供商,21 个价格变动追踪 +- ✅ 最新:Claude Opus 4.6 降价 67%、DeepSeek V4 1M context $0.30/M +- ✅ 免费层详细说明(含 RPM/日额度) +- ✅ "Best for use case" 推荐 +- ✅ Provider 分类(Frontier/Inference/Open-Source/Specialized) + +**弱点**: +- ❌ 无自动报告生成 +- ❌ 无国内 CNY 价格 +- ❌ 无告警推送 +- ❌ 非开源 + +--- + +### 竞品 3:硅基流动(siliconflow.cn)⭐⭐⭐⭐ **定位**:国内最具价格竞争力的 AI 模型聚合平台 -**核心数据**(实测): -- 模型数量:50+(持续增加) -- 价格:**国内最低价之一** -- 结算:CNY,按量计费 -- 支持:OpenAI 兼容 API,SDK 丰富 - -**定价亮点**(参考): -- DeepSeek V3:极低价格(厘级/千tokens) -- Qwen-Turbo:低至 0.1 元/千tokens -- GPT-4o:比官方低 30-50% +**实测数据**(2026-05-04): +- 模型:50+(DeepSeek / Qwen / GLM / Kimi / MiniMax / OpenAI 全覆盖) +- 结算:CNY,无汇率风险 +- 免费:100 req/天 + $1 赠送积分 +- 亮点价格: + - DeepSeek-V4-Flash:¥0.14/M input(全球最低之一) + - Qwen3-VL-8B:¥0.18/M input + - Kimi-K2.5:¥0.23/M input(性价比极高) **优势**: -- ✅ 中文界面,本土化好 -- ✅ CNY 定价,无汇率烦恼 -- ✅ 价格透明,官网明码标价 -- ✅ 稳定性和速度不错 +- ✅ 中文界面,CNY 明码标价 +- ✅ 按量付费,无最低消费 +- ✅ OpenAI 兼容 API,迁移成本低 **弱点**: -- ❌ 仅覆盖国内用户常用模型 -- ❌ 无模型能力评测数据 -- ❌ 无每日报告/告警功能 +- ❌ 无每日自动报告 +- ❌ 无价格变动告警 +- ❌ 无评测数据聚合 - ❌ 非开源 --- -### 竞品 3:truefoundry/models(GitHub)⭐⭐⭐ +### 竞品 4:Artificial Analysis ⭐⭐⭐ -**数据规模**:21 提供商,1000+ 模型配置 +**定位**:LLM 性能排行榜 + 成本计算器 **优势**: -- ✅ YAML 结构化,字段完整 -- ✅ 社区驱动,字段标准化程度高 -- ✅ 开源自部署 - -**弱点**: -- ❌ 非实时,需人工 PR 更新 -- ❌ 无自动化采集 -- ❌ 无报告/告警 - ---- - -### 竞品 4:Artificial Analysis(artificialanalysis.ai)⭐⭐⭐ - -**定位**:LLM 性能排行榜 + 成本计算 - -**优势**: -- ✅ 权威性能数据(MMLU/HumanEval 等) -- ✅ 成本计算器 +- ✅ MMLU / HumanEval / GSM8K 等权威基准分 +- ✅ 性能/价格排行榜 **弱点**: - ❌ 付费为主,免费功能有限 -- ❌ 无免费模型深度追踪 -- ❌ 无区域定价差异 -- ❌ 非开源 +- ❌ 无 CNY 定价 +- ❌ 无自动报告 +- ❌ 无国内厂商 --- -### 竞品 5:ClawHub(clawhub.ai)⭐⭐⭐⭐ +### 竞品 5:truefoundry/models ⭐⭐⭐ -**数据规模**:52,700+ 工具,180,000+ 用户,12M+ 下载,平均 4.8 ⭐ +**数据规模**:21 提供商,1000+ 模型配置(YAML) -**热门 Skills**: -1. Self-Improving Agent — 418k 下载 -2. Skill Vetter — 228k 下载(安全审计) -3. Self-Improving + Proactive Agent — 179k 下载 -4. ontology — 175k 下载(知识图谱) -5. Github — 169k 下载 -6. Gog — 166k 下载(Google Workspace) -7. Polymarket — 154k 下载(预测市场) -8. Proactive Agent — 152k 下载 -9. Weather — 144k 下载 -10. Multi Search Engine — 133k 下载 +**优势**: +- ✅ 字段标准化,开源自部署 +- ✅ 社区驱动,字段完整 **弱点**: -- ❌ 不是 LLM 信息追踪平台(是工具 Skills 市场) -- ❌ 主要面向 OpenClaw 用户 +- ❌ 非实时(人工 PR 更新) +- ❌ 无自动化采集 +- ❌ 无每日报告/告警 --- -## 三、竞品功能矩阵 +## 四、竞品功能矩阵(v3 更新) -| 功能 | OpenRouter | 硅基流动 | truefoundry | Artificial Analysis | **本文产品(目标)** | -|------|------------|----------|-------------|---------------------|----------------------| -| 模型数量 | 371 | 50+ | 1000+ | 不明 | **500+** | -| 实时数据 | ✅ API | ✅ API | ❌ PR | ❌ 定期 | **✅ 每日** | -| 区域定价 | ❌ | ✅ CNY | ❌ | ❌ | **✅ 双视图** | -| 免费政策 | ✅ 标记 | ✅ 详细 | ❌ | ✅ 基础 | **✅ 详细追踪** | -| 国内厂商 | 有限 | ✅ 全 | ✅ | ❌ | **✅ 12家** | +| 功能 | OpenRouter | AgentDeals | 硅基流动 | Artificial Analysis | **本文产品(目标)** | +|------|------------|------------|----------|---------------------|----------------------| +| 模型数量 | 371+ | 19+ | 50+ | 不明 | **500+** | +| 实时数据 | ✅ API | ✅ 月更 | ✅ API | 定期 | **✅ 每日** | +| CNY 定价 | ❌ | ❌ | ✅ | ❌ | **✅** | +| USD 定价 | ✅ | ✅ | 部分 | ✅ | **✅** | +| 国内厂商 | 有限 | 有限 | ✅全 | ❌ | **✅ 12家** | +| 免费政策 | ✅ 标记 | ✅ 详细 | ✅ | ✅ 基础 | **✅ 详细追踪** | | 性能评测 | ❌ | ❌ | ❌ | ✅ | **✅ 聚合** | | 告警通知 | ❌ | ❌ | ❌ | ❌ | **✅** | -| 每日报告 | ❌ | ❌ | ❌ | ❌ | **✅ 自动** | -| Web 界面 | ✅ | ✅ | ❌ | ✅ 付费 | **✅** | -| 中文界面 | ❌ | ✅ | ❌ | ❌ | **✅** | -| API 接口 | ✅ | ✅ | ❌ | ❌ | **✅** | +| 每日报告 | ❌ | ❌ | ❌ | ❌ | **✅** | +| 中文界面 | ❌ | ❌ | ✅ | ❌ | **✅** | +| Web 界面 | ✅ | ✅ | ✅ | ✅付费 | **✅** | | MCP Server | ❌ | ❌ | ❌ | ❌ | **✅** | --- -## 四、SWOT 分析 +## 五、SWOT 分析(更新版) ### 优势(Strengths) -- 覆盖最全:国内外 20+ 厂商 + 30+ 运营商 -- 差异化功能:每日自动报告 + 区域定价对比 + 免费政策详细库 -- 中文优先:全中文界面,钉钉/飞书推送 -- Agent 集成:MCP Server 供 AI 自动查询 +- **覆盖最全**:国内外 20+ 厂商 + 30+ 运营商 +- **差异化功能**:每日自动报告 + CNY/USD 双视图 + 免费政策详细库 +- **中文优先**:全中文界面,钉钉/飞书推送 +- **Agent 集成**:MCP Server 供 AI 自动查询最优模型 ### 劣势(Weaknesses) - 初期数据采集成本高(20+ 数据源需逐一接入) @@ -218,9 +213,9 @@ - 无现成品牌认知 ### 机会(Opportunities) -- 市场空白:区域定价 + 每日报告 + 国内厂商全覆盖 → 无直接竞品 -- 需求真实:AI Agent 选型、成本控制需求持续增长 -- 生态契合:可与 OpenClaw/ClawHub 形成联动(Model-ID-Cheatsheet 互补) +- **市场空白**:区域定价 + 每日报告 + 国内厂商全覆盖 → 无直接竞品 +- **需求真实**:AI Agent 选型、成本控制需求持续增长 +- **差异化**:AgentDeals 有英文数据但无中文;硅基流动有价格但无报告 ### 威胁(Threats) - 大厂自己做:OpenRouter/硅基流动可能推出类似功能 @@ -229,69 +224,27 @@ --- -## 五、定价策略建议 +## 六、快速参考:当前市场价格底线(2026-05-04) -### 5.1 潜在商业模式 +### 全球最低价 TOP 5(per MT input) +1. **xAI Grok 4.1 Fast** — $0.20(海外) +2. **Groq Llama 4 Scout** — $0.11(海外,开源) +3. **DeepSeek V4** — $0.30(1M context,海外) +4. **Step 3.5 Flash** — ¥0.10(国内) +5. **DeepSeek V4-Flash** — ¥0.14(国内硅基流动) -| 模式 | 说明 | 可行性 | -|------|------|--------| -| **免费 + 增值订阅** | 基础功能免费,高级报告/告警付费 | 高 | -| **B2B 企业授权** | 企业内网部署,定制数据源 | 中 | -| **API 按调用收费** | AI Agent 通过 API 查询最优模型 | 中 | -| **数据报告订阅** | 定期发布 LLM 市场分析报告 | 低(竞品多) | - -### 5.2 初期定价建议 - -- **个人用户**:免费(基础数据库 + 每日报告) -- **团队版**:¥99/月(告警 + 成本计算 + API 访问) -- **企业版**:¥299/月(私有部署 + 定制数据源 + Slack/钉钉推送) +### 国内厂商价格对比(per MT,CNY) +| 厂商 | 性价比最高 | 价格区间 | +|------|-----------|----------| +| DeepSeek | V3.2 / V4-Flash | ¥0.14-0.27 | +| 阿里 Qwen | 3-VL-32B | ¥0.18-0.60 | +| 智谱 GLM | 4.7 / 5.1 | ¥0.42-1.40 | +| Moonshot Kimi | K2.5 | ¥0.07-0.95 | +| MiniMax | M2.5 | ¥0.03-0.30 | +| 腾讯 | Hunyuan-A13B | ¥0.14-0.57 | +| 百度 | ERNIE-4.5-300B | ¥0.28-1.10 | --- -## 六、结论 - -**市场定位**:面向中文开发者和 AI 团队的 LLM 情报中心 - -**核心差异化**(对比现有竞品): -1. **每日自动报告**(独家功能) -2. **区域定价双视图**(国内 CNY + 海外 USD,同模型对比) -3. **国内厂商全覆盖**(12 家国内厂商 vs OpenRouter 仅限海外) -4. **免费政策详细库**(额度/限流/区域限制全追踪) -5. **中文界面 + 钉钉/飞书推送**(本土化体验) -6. **MCP Server**(Agent 集成能力,竞品无) - -**快速启动路径**: -1. Phase 1:OpenRouter API(371 模型)+ 10 家国内主流厂商 → MVP -2. Phase 2:Web Dashboard + 每日报告 + 告警 -3. Phase 3:API + MCP Server → AI Agent 生态集成 - ---- - -## 七、数据附录 - -### 7.1 OpenRouter API 实测字段 -```json -{ - "id": "openai/gpt-4.5", - "name": "OpenAI: GPT-4.5", - "provider_name": "OpenAI", - "context_length": 128000, - "pricing": {"prompt_tokens": 0.0000025, "completion_tokens": 0.00001}, - "supported_parameters": ["max_tokens", "temperature", "top_p"], - "top_provider": "OpenAI", - "expiration_date": null -} -``` - -### 7.2 GitHub LLM 相关热门项目参考 -| 项目 | Stars | 功能 | -|------|-------|------| -| ComfyUI | 111k | 扩散模型 GUI/API/后端 | -| funNLP | 80k | 中英文 NLP 工具库 | -| LibreChat | 36k | ChatGPT 克隆(支持 MCP/DeepSeek) | -| Xinference | 9k | Xorbits 开源推理框架 | - ---- - -**报告编制**:宰相 -**数据来源**:OpenRouter API 实测、GitHub Search API、竞品公开页面(2026-05-03) +**报告编制**:宰相(AI 辅助) +**数据来源**:AgentDeals.dev 实测、硅基流动官网(2026-05-04)、dev.to TokenMix.ai(2026-05) \ No newline at end of file diff --git a/PRD.md b/PRD.md index f3982ff..e5d3ada 100644 --- a/PRD.md +++ b/PRD.md @@ -1,7 +1,7 @@ # LLM Intelligence Hub — 产品需求文档 v0.2 -> 文档版本:v0.2(全面升级版) -> 日期:2026-05-03 +> 文档版本:v0.3(2026年5月数据更新版) +> 日期:2026-05-04 > 负责人:宰相(AI 辅助) > 状态:初稿,征询中 @@ -11,9 +11,9 @@ ### 1.1 背景 -**大模型市场竞争格局**: -- **中国**:百度 ERNIE、阿里 Qwen、腾讯 Hunyuan、字节 Doubao、DeepSeek、智谱 GLM、华为 Pangu、讯飞 Spark、Moonshot Kimi、零一万物 Yi、MiniMax、商汤 SenseChat 等 -- **海外**:OpenAI GPT 系列、Anthropic Claude、Google Gemini、Meta Llama、xAI Grok、Mistral 等 +**大模型市场竞争格局**(2026年5月最新): +- **国内第一梯队**:DeepSeek V3.2 / V4-Flash(RMB最低价)+ Kimi K2.6(首个超越GPT-5.4的开源模型)+ Qwen3.6(开源最强)+ GLM-5.1(综合) +- **海外第一梯队**:xAI Grok 4.1 Fast($0.20/M,史上最便宜前沿模型)+ Claude Opus 4.6(降价67%至$5/$25)+ GPT-5系列 - **云平台**:阿里云、腾讯云、百度云、华为云、火山引擎(字节)等国内平台;AWS Bedrock、Azure OpenAI、Google Cloud 等海外平台 - **中转聚合**:硅基流动(SiliconFlow)、OpenRouter、Together AI、Groq、Cloudflare Workers AI 等 @@ -201,21 +201,21 @@ LLM Intelligence Hub ### 4.1 模型商(目标 20+) -#### 国内厂商(目标 12 家) -| 厂商 | 代表模型 | API 平台 | -|------|----------|----------| -| 百度 | ERNIE-4.0 / ERNIE-Speed | qianfan.llm.yundun.cn | -| 阿里 | Qwen-Turbo / Qwen-Max / Qwen2.5 | dashscope.aliyun.com | -| 腾讯 | Hunyuan-Pro / Hunyuan-Standard | hunyuan.cloud.tencent.com | -| 字节 | Doubao-Pro-32K / Doubao-lite | volcengine.com | -| DeepSeek | V3 / Coder V3 / Chat | platform.deepseek.com | -| 智谱 | GLM-4 / GLM-4V / GLM-3Turbo | open.bigmodel.cn | -| 华为 | Pangu-4 / Pangu-3 | modelarts.huaweicloud.com | -| 讯飞 | Spark-4.0 / Spark-3.5 | xfyun.cn | -| Moonshot | Kimi-1.5 / Kimi-32K | platform.moonshot.cn | -| 零一万物 | Yi-Large / Yi-Medium | platform.01.ai | -| MiniMax | abab-7B / MiniMax-01 | api.minimax.chat | -| 昆仑万维 | Skywork-13B | tiangong.kunlun.com | +#### 国内厂商(目标 12 家,2026-05 实际定价) +| 厂商 | 代表模型 | 输入 CNY/MT | 输出 CNY/MT | 最新动态 | +|------|----------|-----------|-----------|----------| +| DeepSeek | V3.2 / V4-Flash / R1 | ¥0.14-0.27 | ¥0.028-0.135 | V4-Flash:全球最便宜1M context | +| 阿里 | Qwen3-VL-32B / 8B | ¥0.18-0.20 | ¥0.60-0.68 | Qwen3.6 开源性能逼近闭源 | +| Moonshot | Kimi K2.6 / K2.5 | ¥0.23-0.95 | ¥0.07-0.16 | K2.6 超越 GPT-5.4(SWE-Bench Pro) | +| 智谱 | GLM-5.1 / GLM-4.7 | ¥0.42-1.40 | ¥0.11-0.26 | GLM-5.1 编码能力接近 Opus 4.6 | +| MiniMax | M2.5 | ¥0.30 | ¥0.03 | 多模态+语音,API 性价比极高 | +| 字节 | Doubao / Step-3.5-Flash | ¥0.10+ | — | Step-3.5 Flash 约 GPT-4o 的 1/25 价格 | +| 百度 | ERNIE-4.5-300B | ¥0.28 | ¥1.10 | 老牌旗舰,搜索集成 | +| 腾讯 | Hunyuan-A13B | ¥0.14 | ¥0.57 | 腾讯系生态集成 | +| 华为 | Pangu-4 / 3 | 企业定价 | 企业定价 | 政务/国企客户多 | +| 讯飞 | Spark-4.0 | 企业定价 | 企业定价 | 语音交互强 | +| 零一万物 | Yi-Large | 企业定价 | 企业定价 | 开源 Yi 系列 | +| 昆仑万维 | Skywork-13B | 企业定价 | 企业定价 | 开源系列 | #### 海外厂商(目标 10 家) | 厂商 | 代表模型 | API 平台 |