This commit is contained in:
146
PRD.md
146
PRD.md
@@ -1,9 +1,9 @@
|
||||
# LLM Intelligence Hub — 产品需求文档 v0.2
|
||||
# LLM Intelligence Hub — 产品需求文档 v0.3
|
||||
|
||||
> 文档版本:v0.3(2026年5月数据更新版)
|
||||
> 日期:2026-05-04
|
||||
> 文档版本:v0.3
|
||||
> 日期:2026-05-09
|
||||
> 负责人:宰相(AI 辅助)
|
||||
> 状态:初稿,征询中
|
||||
> 状态:Phase 1 已冻结,执行中(采集器/数据库/日报已落地)
|
||||
|
||||
---
|
||||
|
||||
@@ -46,7 +46,26 @@
|
||||
|
||||
---
|
||||
|
||||
## 二、数据模型设计
|
||||
## 二、Phase 1 范围
|
||||
|
||||
### 范围
|
||||
- 聚焦模型定价数据:采集 → 存储 → 报告三条链路落地
|
||||
- 单条链路覆盖:OpenRouter(采集器)、PostgreSQL(存储)、Markdown 日报(报告输出到 reports/daily/)
|
||||
- Explorer 页面:模型表格,支持筛选、排序、免费标记
|
||||
- Dashboard 占位图:价格趋势示意(数据来自日报生成命令可重放)
|
||||
|
||||
### 非目标
|
||||
- ❌ 多租户、用户登录、权限系统
|
||||
- ❌ 图表组件库(用占位图替代)
|
||||
- ❌ 邮件/飞书/...推送
|
||||
- ❌ 多数据源并行采集(Phase 2 才扩展 OpenRouter/Together/Groq 等)
|
||||
|
||||
### 验收标准
|
||||
1. scripts/fetch_openrouter.go 存在且可单独运行,抓取结果写入 PostgreSQL
|
||||
2. db/migrations/*.sql 落地三张表:models、model_prices、report_runs
|
||||
3. 日报生成命令运行后在 reports/daily/ 目录产出 Markdown 文件
|
||||
|
||||
## 三、数据模型设计
|
||||
|
||||
### 2.1 核心实体
|
||||
|
||||
@@ -127,7 +146,7 @@ LLM Intelligence Hub
|
||||
|
||||
---
|
||||
|
||||
## 三、功能需求
|
||||
## 四、功能需求
|
||||
|
||||
### 3.1 数据采集层(Must Have)
|
||||
|
||||
@@ -197,7 +216,7 @@ LLM Intelligence Hub
|
||||
|
||||
---
|
||||
|
||||
## 四、覆盖范围
|
||||
## 五、覆盖范围
|
||||
|
||||
### 4.1 模型商(目标 20+)
|
||||
|
||||
@@ -278,85 +297,64 @@ LLM Intelligence Hub
|
||||
|
||||
---
|
||||
|
||||
## 五、非功能需求
|
||||
## 六、竞品对比
|
||||
|
||||
### 5.1 技术要求
|
||||
- **部署**:Docker 支持,内网可部署
|
||||
- **数据库**:PostgreSQL(主)+ TimescaleDB(时序) / SQLite(轻量版)
|
||||
- **存储量**:500+ 模型 × 50 字段 ≈ 100MB,每日增量 ~1MB
|
||||
- **性能**:报告生成 < 30 秒,API 响应 < 500ms
|
||||
|
||||
### 5.2 运维要求
|
||||
- **自动更新**:每日 08:00 cron 触发采集 + 报告生成
|
||||
- **监控**:失败告警、日志留存 30 天
|
||||
- **备份**:数据库每日备份
|
||||
- **告警阈值**:采集失败连续 3 天 / 价格变动 > 20%
|
||||
|
||||
### 5.3 数据质量
|
||||
- **来源标注**:每条数据标注来源 URL,可溯源
|
||||
- **置信度**:数据分"官方确认" / "文档推断" / "待核实"
|
||||
- **更新标记**:过期数据标记"已失效",保留历史
|
||||
| 维度 | OpenRouter | AgentDeals | 硅基流动 | Artificial Analysis | **LLM Intelligence Hub** |
|
||||
|------|------------|------------|----------|---------------------|----------------------|
|
||||
| 模型数量 | 371+ | 19+ | 50+ | 不明 | **500+** |
|
||||
| 实时数据 | ✅ API | ✅ 月更 | ✅ API | 定期 | **✅ 每日** |
|
||||
| CNY 定价 | ❌ | ❌ | ✅ | ❌ | **✅** |
|
||||
| USD 定价 | ✅ | ✅ | 部分 | ✅ | **✅** |
|
||||
| 国内厂商 | 有限 | 有限 | ✅全 | ❌ | **✅ 12家** |
|
||||
| 免费政策 | ✅ 标记 | ✅ 详细 | ✅ | ✅ 基础 | **✅ 详细追踪** |
|
||||
| 性能评测 | ❌ | ❌ | ❌ | ✅ | **✅ 聚合** |
|
||||
| 告警通知 | ❌ | ❌ | ❌ | ❌ | **✅** |
|
||||
| 每日报告 | ❌ | ❌ | ❌ | ❌ | **✅** |
|
||||
| 中文界面 | ❌ | ❌ | ✅ | ❌ | **✅** |
|
||||
| Web 界面 | ✅ | ✅ | ✅ | ✅付费 | **✅** |
|
||||
| MCP Server | ❌ | ❌ | ❌ | ❌ | **✅** |
|
||||
|
||||
---
|
||||
|
||||
## 六、竞品分析摘要
|
||||
## 七、里程碑
|
||||
|
||||
| 竞品 | 覆盖 | 区域定价 | 免费政策 | 每日报告 | 中文 |
|
||||
|------|------|----------|----------|----------|------|
|
||||
| OpenRouter | 371 模型(海外为主)| ❌ | ✅ 标记 | ❌ | ❌ |
|
||||
| Artificial Analysis | 性能排行 | ❌ | ✅ 基础 | ❌ | ❌ |
|
||||
| truefoundry/models | 1000+ 配置(YAML) | ❌ | ❌ | ❌ | ❌ |
|
||||
| 硅基流动 | 中转聚合 | ✅ CNY | ✅ 详细 | ❌ | ✅ |
|
||||
| **本文产品(目标)** | **20+厂商 500+模型** | **✅ 双视图** | **✅ 详细** | **✅ 自动** | **✅** |
|
||||
| Phase | 时间 | 目标 | 关键交付 |
|
||||
|-------|------|------|----------|
|
||||
| **Phase 1** | 2026-Q2 | MVP 上线 | 采集+存储+日报+Explorer |
|
||||
| **Phase 2** | 2026-Q3 | 多数据源+告警 | 国内厂商采集+推送+趋势图 |
|
||||
| **Phase 3** | 2026-Q4 | 商业化 | 订阅付费+API+MCP Server |
|
||||
|
||||
---
|
||||
|
||||
## 七、上线计划
|
||||
## 八、术语表
|
||||
|
||||
| 阶段 | 内容 | 目标 | 工期 |
|
||||
|------|------|------|------|
|
||||
| **Phase 0** | PRD 确认 + 技术方案选定 | 1 周 | 2026-05 第1周 |
|
||||
| **Phase 1** | OpenRouter 371 模型 + 10 主流国内厂商接入 + 静态报告 | 2 周 | 2026-05 第2-3周 |
|
||||
| **Phase 2** | Web Dashboard + 告警 + 成本计算器 | 2 周 | 2026-05 第4周-6月第1周 |
|
||||
| **Phase 3** | API 开放 + MCP Server + Agent 集成 | 1 周 | 2026-06 第2周 |
|
||||
| 术语 | 定义 |
|
||||
|------|------|
|
||||
| MTok | Million Tokens,百万 Token |
|
||||
| Reseller | 中转聚合平台(如硅基流动、OpenRouter) |
|
||||
| ELO | 模型质量评分系统(OpenRouter 采用) |
|
||||
| Context Length | 上下文窗口长度(tokens) |
|
||||
| Free Tier | 免费额度层 |
|
||||
| Capability | 模型能力(如 vision、function calling) |
|
||||
|
||||
---
|
||||
|
||||
## 八、风险与依赖
|
||||
## 九、参考链接
|
||||
|
||||
| 风险 | 影响 | 应对 |
|
||||
|------|------|------|
|
||||
| 国内厂商 API 变更/限速 | 采集失败 | 多源备份 + 人工补充机制 |
|
||||
| 中转平台被墙/不稳定 | 数据不可用 | 标注平台稳定性评级 |
|
||||
| 价格更新太频繁 | 报告滞后 | 变更触发实时告警,不等每日同步 |
|
||||
| 数据版权问题 | 合规风险 | 仅采集公开数据,标注来源 |
|
||||
### 8.1 数据来源
|
||||
- OpenRouter API Docs: `https://openrouter.ai/docs`
|
||||
- 硅基流动定价: `https://siliconflow.cn/pricing`
|
||||
- AgentDeals.dev: `https://agentdeals.dev`
|
||||
- Artificial Analysis: `https://artificialanalysis.ai`
|
||||
|
||||
---
|
||||
|
||||
## 九、用户故事
|
||||
|
||||
| # | 用户 | 故事 |
|
||||
|---|------|------|
|
||||
| U1 | 立立(研发) | "每天早上我花2分钟看报告,知道今天哪个模型最值得用" |
|
||||
| U2 | 小龙(项目经审) | "我想查'中文写作性价比最高的免费模型',5秒找到答案" |
|
||||
| U3 | 宰相(AI 助理) | "我想调用 API 自动为用户选择最优模型,不用每次问人" |
|
||||
| U4 | 财务(成本管理) | "我想看到本月各模型花费占比,作为预算依据" |
|
||||
| U5 | 项目经审(决策者) | "我想知道国内模型和国际模型的成本差异,辅助选型决策" |
|
||||
|
||||
---
|
||||
|
||||
## 十、附录
|
||||
|
||||
### 10.1 参考资料
|
||||
- OpenRouter API: `https://openrouter.ai/api/v1/models`
|
||||
- 硅基流动定价: `https://siliconflow.cn/zh-stilling/price`
|
||||
- AWS Bedrock 定价: `https://aws.amazon.com/bedrock/pricing/`
|
||||
- Azure OpenAI 定价: `https://azure.microsoft.com/en-us/pricing/details/cognitive-services/openai-service/`
|
||||
### 8.2 厂商开放平台
|
||||
- OpenAI: `https://platform.openai.com/pricing`
|
||||
- Anthropic: `https://console.anthropic.com`
|
||||
- 百度 ERNIE: `https://qianfan.llm.yundun.cn/`
|
||||
- 阿里 DashScope: `https://help.aliyun.com/zh/dashscope/`
|
||||
- DeepSeek: `https://platform.deepseek.com/`
|
||||
|
||||
### 10.2 数据字典(核心字段)
|
||||
### 8.3 数据字典(核心字段)
|
||||
|
||||
| 字段 | 类型 | 说明 | 示例 |
|
||||
|------|------|------|------|
|
||||
@@ -370,3 +368,15 @@ LLM Intelligence Hub
|
||||
| free_tier | text | 免费额度描述 | "每日100次,每次不超过4000 tokens" |
|
||||
| context_length | int | 上下文窗口 | 128000 |
|
||||
| capabilities | array | 能力列表 | ["vision","function_calling"] |
|
||||
|
||||
---
|
||||
|
||||
## 十一、数据质量与血缘
|
||||
|
||||
**六、数据质量与血缘**
|
||||
- 数据校验规则:价格不能为负、context_length 不能超过 10M、currency 必须为 CNY/USD/EUR 之一
|
||||
- 数据新鲜度指标:每条记录标注 `retrieved_at`,超过 24h 标记为 stale
|
||||
- 数据血缘追踪:每条价格记录记录来源 API URL、采集批次号、采集器版本
|
||||
- 质量分级:official(官方API)/ inferred(推导)/ unverified(未验证)/ stale(过期)
|
||||
- 自动清洗:采集失败时保留上次成功数据,标记 "data_stale_until_next_run"
|
||||
- 质量报告:每日报告包含数据质量摘要(覆盖率/新鲜度/异常数)
|
||||
|
||||
Reference in New Issue
Block a user