forked from niuniu/llm-intelligence
181 lines
6.1 KiB
Markdown
181 lines
6.1 KiB
Markdown
# LLM Intelligence Hub — 产品需求文档 v0.1
|
||
|
||
> 文档版本:v0.1
|
||
> 日期:2026-05-03
|
||
> 负责人:宰相(AI 辅助)
|
||
> 状态:初稿,征询中
|
||
|
||
---
|
||
|
||
## 一、产品概述
|
||
|
||
### 1.1 背景与问题
|
||
|
||
**背景**:
|
||
- 大模型(LLM)市场竞争激烈,OpenAI/Anthropic/Google/DeepSeek/Meta 等提供商持续发布新版本、调整定价和免费政策
|
||
- 「立交桥」项目需要在多个 AI Agent 间做模型决策,需要实时掌握各模型的能力、定价、免费额度、区域限制等信息
|
||
- 现有信息分散在多个平台(OpenRouter、Anthropic 官网、Google AI Studio、GitHub 等),缺乏统一聚合视图
|
||
|
||
**核心问题**:
|
||
1. 模型信息分散,更新不及时
|
||
2. 免费政策区域差异大,难以获取完整信息
|
||
3. 定价随版本快速变化,人工维护成本高
|
||
4. 缺乏一个可持续积累的 LLM 知识库
|
||
|
||
### 1.2 目标
|
||
|
||
**建设一个可持续运营的 LLM 情报中心**:
|
||
- 自动采集 + 人工补充,持续追踪 20+ 提供商的模型动态
|
||
- 建立结构化 LLM 数据库(定价/能力/政策/评测)
|
||
- 每日自动生成可视化报告(Web 页面)
|
||
- 支持按场景(编码/写作/推理/免费)筛选最优模型
|
||
|
||
### 1.3 成功指标
|
||
|
||
| 指标 | 目标值 |
|
||
|------|--------|
|
||
| 模型覆盖率 | 20+ 提供商,500+ 模型 |
|
||
| 信息更新频率 | 每日增量更新 |
|
||
| 报告生成 | 每日 08:00 自动生成 |
|
||
| Web 可访问性 | 内网可访问,支持导出 PDF |
|
||
|
||
---
|
||
|
||
## 二、功能需求
|
||
|
||
### 2.1 核心功能(Must Have)
|
||
|
||
#### F1:模型数据库
|
||
- **字段**:模型名称、提供商、版本、API ID、输入价格、输出价格、上下文窗口、Capabilities(Vision/Tools/JSON等)、免费标记、免费额度、区域限制、更新时间
|
||
- **来源**:OpenRouter API(724模型)、Anthropic/Google 官方文档、GitHub 模型列表
|
||
- **更新策略**:每日增量同步 + 人工校正
|
||
|
||
#### F2:免费政策追踪
|
||
- **内容**:各提供商免费模型列表、免费额度说明、限流规则、区域限制
|
||
- **特殊标记**:限时免费、试用政策、新用户优惠
|
||
|
||
#### F3:区域定价追踪
|
||
- **内容**:同一模型在不同区域的定价差异(如中国区 vs 全球区)
|
||
- **货币支持**:USD/CNY/EUR 汇率换算
|
||
|
||
#### F4:每日报告生成
|
||
- **格式**:Web 页面(HTML)+ PDF 导出
|
||
- **内容**:
|
||
- 今日新上线/更新模型
|
||
- 价格变动提醒
|
||
- 免费政策变更
|
||
- 热门模型 TOP 10 推荐(按场景)
|
||
- 成本优化建议
|
||
|
||
#### F5:搜索与筛选
|
||
- **筛选维度**:提供商、免费/付费、场景(编码/写作/推理)、价格区间、上下文长度
|
||
- **搜索**:模型名称、提供商、特性关键词
|
||
|
||
### 2.2 进阶功能(Should Have)
|
||
|
||
#### F6:价格对比计算器
|
||
- 输入 Token 数量 → 输出各提供商成本对比
|
||
- 按月成本估算
|
||
|
||
#### F7:模型评测排行榜
|
||
- 聚合 MMLU / HumanEval / GSM8K / MATH 等基准评测数据
|
||
- 按场景排名(编码/推理/写作/免费)
|
||
|
||
#### F8:告警系统
|
||
- 价格变动 > 10% 触发告警
|
||
- 新模型上线通知
|
||
- 免费额度变更通知
|
||
|
||
#### F9:API 接口
|
||
- 提供 JSON API 供其他系统集成
|
||
- 支持 AI Agent 查询最优模型
|
||
|
||
### 2.3 未来功能(Nice to Have)
|
||
|
||
#### F10:竞品追踪
|
||
- 追踪各提供商市场份额、融资动态、战略动向
|
||
|
||
#### F11:多语言界面
|
||
- 中文 / 英文双语界面
|
||
|
||
---
|
||
|
||
## 三、非功能需求
|
||
|
||
### 3.1 技术要求
|
||
- **部署**:内网服务器,支持 Docker 部署
|
||
- **存储**:SQLite(轻量)+ PostgreSQL(生产)
|
||
- **数据量**:预估 500+ 模型 × 50+ 字段,每日增量 10-50 条
|
||
- **性能**:报告生成 < 30 秒
|
||
|
||
### 3.2 运维要求
|
||
- **自动更新**:每日 08:00 cron 触发数据同步
|
||
- **监控**:失败告警、日志留存 30 天
|
||
- **备份**:数据库每日增量备份
|
||
|
||
### 3.3 安全要求
|
||
- **访问控制**:内网认证(如需)
|
||
- **数据来源标注**:所有数据标注来源 URL,确保可溯源
|
||
|
||
---
|
||
|
||
## 四、竞品参考
|
||
|
||
| 竞品 | URL | 核心能力 | 弱点 |
|
||
|------|-----|---------|------|
|
||
| OpenRouter | openrouter.ai/models | 724模型实时数据,免费标记,ELO排名 | 无中文界面,不追踪区域定价 |
|
||
| AIPriceIndex | (GitHub) | LLM 定价历史追踪 | 仅定价,无评测 |
|
||
| Artificial Analysis | artificialanalysis.ai | 模型性能排行,成本计算 | 付费为主,无免费模型追踪 |
|
||
| truefoundry/models | (GitHub) | 21提供商 1000+模型配置 | 非实时,需人工 PR 更新 |
|
||
| Model-ID-Cheatsheet | (GitHub) | 107模型精确 ID | 仅 API ID,无定价 |
|
||
|
||
---
|
||
|
||
## 五、技术方案建议
|
||
|
||
### 方案 A(快速启动)
|
||
- **数据源**:OpenRouter API + 官方文档爬虫
|
||
- **存储**:SQLite + 每日 CSV 导出
|
||
- **报告**:静态 HTML 页面 + GitHub Pages 托管
|
||
- **工期**:2 周 MVP
|
||
|
||
### 方案 B(生产级)
|
||
- **数据源**:OpenRouter + Anthropic + Google + DeepSeek 官方 API
|
||
- **存储**:PostgreSQL + TimescaleDB(时序数据)
|
||
- **报告**:Web Dashboard(React) + PDF 自动生成
|
||
- **告警**:邮件/钉钉通知
|
||
- **工期**:4-6 周
|
||
|
||
---
|
||
|
||
## 六、用户故事
|
||
|
||
| # | 用户 | 故事 |
|
||
|---|------|------|
|
||
| U1 | 立立 | "我每天早上看一眼报告,就知道今天该用哪个模型省钱" |
|
||
| U2 | 小龙 | "我想查某个场景下最便宜的免费模型,5秒内找到" |
|
||
| U3 | 宰相 | "我想让 AI Agent 能自动查询最优模型,不用每次问人" |
|
||
| U4 | 项目经审 | "我想看到本周价格变动汇总,作为成本核算依据" |
|
||
|
||
---
|
||
|
||
## 七、风险与依赖
|
||
|
||
| 风险 | 影响 | 应对 |
|
||
|------|------|------|
|
||
| 数据源 API 变更 | 爬虫失效 | 多源交叉验证,建立镜像 |
|
||
| 免费额度频繁调整 | 报告滞后 | 每日检查 + 变更告警 |
|
||
| 提供商定价策略差异化 | 数据结构复杂 | 设计灵活 schema,支持扩展字段 |
|
||
|
||
---
|
||
|
||
## 八、上线计划
|
||
|
||
| 阶段 | 内容 | 目标 |
|
||
|------|------|------|
|
||
| Phase 0 | 需求确认 + 技术方案选定 | 1 周 |
|
||
| Phase 1 | MVP:10 提供商数据 + 静态报告 | 2 周 |
|
||
| Phase 2 | Web Dashboard + 告警 + 评测排行 | 2 周 |
|
||
| Phase 3 | API 开放 + Agent 集成 | 1 周 |
|
||
|