Files
llm-intelligence/PRD.md

181 lines
6.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# LLM Intelligence Hub — 产品需求文档 v0.1
> 文档版本v0.1
> 日期2026-05-03
> 负责人宰相AI 辅助)
> 状态:初稿,征询中
---
## 一、产品概述
### 1.1 背景与问题
**背景**
- 大模型LLM市场竞争激烈OpenAI/Anthropic/Google/DeepSeek/Meta 等提供商持续发布新版本、调整定价和免费政策
- 「立交桥」项目需要在多个 AI Agent 间做模型决策,需要实时掌握各模型的能力、定价、免费额度、区域限制等信息
- 现有信息分散在多个平台OpenRouter、Anthropic 官网、Google AI Studio、GitHub 等),缺乏统一聚合视图
**核心问题**
1. 模型信息分散,更新不及时
2. 免费政策区域差异大,难以获取完整信息
3. 定价随版本快速变化,人工维护成本高
4. 缺乏一个可持续积累的 LLM 知识库
### 1.2 目标
**建设一个可持续运营的 LLM 情报中心**
- 自动采集 + 人工补充,持续追踪 20+ 提供商的模型动态
- 建立结构化 LLM 数据库(定价/能力/政策/评测)
- 每日自动生成可视化报告Web 页面)
- 支持按场景(编码/写作/推理/免费)筛选最优模型
### 1.3 成功指标
| 指标 | 目标值 |
|------|--------|
| 模型覆盖率 | 20+ 提供商500+ 模型 |
| 信息更新频率 | 每日增量更新 |
| 报告生成 | 每日 08:00 自动生成 |
| Web 可访问性 | 内网可访问,支持导出 PDF |
---
## 二、功能需求
### 2.1 核心功能Must Have
#### F1模型数据库
- **字段**模型名称、提供商、版本、API ID、输入价格、输出价格、上下文窗口、CapabilitiesVision/Tools/JSON等、免费标记、免费额度、区域限制、更新时间
- **来源**OpenRouter API724模型、Anthropic/Google 官方文档、GitHub 模型列表
- **更新策略**:每日增量同步 + 人工校正
#### F2免费政策追踪
- **内容**:各提供商免费模型列表、免费额度说明、限流规则、区域限制
- **特殊标记**:限时免费、试用政策、新用户优惠
#### F3区域定价追踪
- **内容**:同一模型在不同区域的定价差异(如中国区 vs 全球区)
- **货币支持**USD/CNY/EUR 汇率换算
#### F4每日报告生成
- **格式**Web 页面HTML+ PDF 导出
- **内容**
- 今日新上线/更新模型
- 价格变动提醒
- 免费政策变更
- 热门模型 TOP 10 推荐(按场景)
- 成本优化建议
#### F5搜索与筛选
- **筛选维度**:提供商、免费/付费、场景(编码/写作/推理)、价格区间、上下文长度
- **搜索**:模型名称、提供商、特性关键词
### 2.2 进阶功能Should Have
#### F6价格对比计算器
- 输入 Token 数量 → 输出各提供商成本对比
- 按月成本估算
#### F7模型评测排行榜
- 聚合 MMLU / HumanEval / GSM8K / MATH 等基准评测数据
- 按场景排名(编码/推理/写作/免费)
#### F8告警系统
- 价格变动 > 10% 触发告警
- 新模型上线通知
- 免费额度变更通知
#### F9API 接口
- 提供 JSON API 供其他系统集成
- 支持 AI Agent 查询最优模型
### 2.3 未来功能Nice to Have
#### F10竞品追踪
- 追踪各提供商市场份额、融资动态、战略动向
#### F11多语言界面
- 中文 / 英文双语界面
---
## 三、非功能需求
### 3.1 技术要求
- **部署**:内网服务器,支持 Docker 部署
- **存储**SQLite轻量+ PostgreSQL生产
- **数据量**:预估 500+ 模型 × 50+ 字段,每日增量 10-50 条
- **性能**:报告生成 < 30 秒
### 3.2 运维要求
- **自动更新**:每日 08:00 cron 触发数据同步
- **监控**:失败告警、日志留存 30 天
- **备份**:数据库每日增量备份
### 3.3 安全要求
- **访问控制**:内网认证(如需)
- **数据来源标注**:所有数据标注来源 URL确保可溯源
---
## 四、竞品参考
| 竞品 | URL | 核心能力 | 弱点 |
|------|-----|---------|------|
| OpenRouter | openrouter.ai/models | 724模型实时数据免费标记ELO排名 | 无中文界面,不追踪区域定价 |
| AIPriceIndex | (GitHub) | LLM 定价历史追踪 | 仅定价,无评测 |
| Artificial Analysis | artificialanalysis.ai | 模型性能排行,成本计算 | 付费为主,无免费模型追踪 |
| truefoundry/models | (GitHub) | 21提供商 1000+模型配置 | 非实时,需人工 PR 更新 |
| Model-ID-Cheatsheet | (GitHub) | 107模型精确 ID | 仅 API ID无定价 |
---
## 五、技术方案建议
### 方案 A快速启动
- **数据源**OpenRouter API + 官方文档爬虫
- **存储**SQLite + 每日 CSV 导出
- **报告**:静态 HTML 页面 + GitHub Pages 托管
- **工期**2 周 MVP
### 方案 B生产级
- **数据源**OpenRouter + Anthropic + Google + DeepSeek 官方 API
- **存储**PostgreSQL + TimescaleDB时序数据
- **报告**Web DashboardReact + PDF 自动生成
- **告警**:邮件/钉钉通知
- **工期**4-6 周
---
## 六、用户故事
| # | 用户 | 故事 |
|---|------|------|
| U1 | 立立 | "我每天早上看一眼报告,就知道今天该用哪个模型省钱" |
| U2 | 小龙 | "我想查某个场景下最便宜的免费模型5秒内找到" |
| U3 | 宰相 | "我想让 AI Agent 能自动查询最优模型,不用每次问人" |
| U4 | 项目经审 | "我想看到本周价格变动汇总,作为成本核算依据" |
---
## 七、风险与依赖
| 风险 | 影响 | 应对 |
|------|------|------|
| 数据源 API 变更 | 爬虫失效 | 多源交叉验证,建立镜像 |
| 免费额度频繁调整 | 报告滞后 | 每日检查 + 变更告警 |
| 提供商定价策略差异化 | 数据结构复杂 | 设计灵活 schema支持扩展字段 |
---
## 八、上线计划
| 阶段 | 内容 | 目标 |
|------|------|------|
| Phase 0 | 需求确认 + 技术方案选定 | 1 周 |
| Phase 1 | MVP10 提供商数据 + 静态报告 | 2 周 |
| Phase 2 | Web Dashboard + 告警 + 评测排行 | 2 周 |
| Phase 3 | API 开放 + Agent 集成 | 1 周 |