chore: prepare repository for publishing
Some checks failed
CI / test (push) Has been cancelled

This commit is contained in:
phamnazage-jpg
2026-05-13 14:42:45 +08:00
parent 55e506b2b5
commit 77e6610fd2
118 changed files with 27373 additions and 1009 deletions

146
PRD.md
View File

@@ -1,9 +1,9 @@
# LLM Intelligence Hub — 产品需求文档 v0.2
# LLM Intelligence Hub — 产品需求文档 v0.3
> 文档版本v0.32026年5月数据更新版
> 日期2026-05-04
> 文档版本v0.3
> 日期2026-05-09
> 负责人宰相AI 辅助)
> 状态:初稿,征询中
> 状态:Phase 1 已冻结,执行中(采集器/数据库/日报已落地)
---
@@ -46,7 +46,26 @@
---
## 二、数据模型设计
## 二、Phase 1 范围
### 范围
- 聚焦模型定价数据:采集 → 存储 → 报告三条链路落地
- 单条链路覆盖OpenRouter采集器、PostgreSQL存储、Markdown 日报(报告输出到 reports/daily/
- Explorer 页面:模型表格,支持筛选、排序、免费标记
- Dashboard 占位图:价格趋势示意(数据来自日报生成命令可重放)
### 非目标
- ❌ 多租户、用户登录、权限系统
- ❌ 图表组件库(用占位图替代)
- ❌ 邮件/飞书/...推送
- ❌ 多数据源并行采集Phase 2 才扩展 OpenRouter/Together/Groq 等)
### 验收标准
1. scripts/fetch_openrouter.go 存在且可单独运行,抓取结果写入 PostgreSQL
2. db/migrations/*.sql 落地三张表models、model_prices、report_runs
3. 日报生成命令运行后在 reports/daily/ 目录产出 Markdown 文件
## 三、数据模型设计
### 2.1 核心实体
@@ -127,7 +146,7 @@ LLM Intelligence Hub
---
## 、功能需求
## 、功能需求
### 3.1 数据采集层Must Have
@@ -197,7 +216,7 @@ LLM Intelligence Hub
---
## 、覆盖范围
## 、覆盖范围
### 4.1 模型商(目标 20+
@@ -278,85 +297,64 @@ LLM Intelligence Hub
---
## 五、非功能需求
## 六、竞品对比
### 5.1 技术要求
- **部署**Docker 支持,内网可部署
- **数据库**PostgreSQL+ TimescaleDB时序 / SQLite轻量版
- **存储量**500+ 模型 × 50 字段 ≈ 100MB每日增量 ~1MB
- **性能**:报告生成 < 30 秒API 响应 < 500ms
### 5.2 运维要求
- **自动更新**:每日 08:00 cron 触发采集 + 报告生成
- **监控**:失败告警、日志留存 30 天
- **备份**:数据库每日备份
- **告警阈值**:采集失败连续 3 天 / 价格变动 > 20%
### 5.3 数据质量
- **来源标注**:每条数据标注来源 URL可溯源
- **置信度**:数据分"官方确认" / "文档推断" / "待核实"
- **更新标记**:过期数据标记"已失效",保留历史
| 维度 | OpenRouter | AgentDeals | 硅基流动 | Artificial Analysis | **LLM Intelligence Hub** |
|------|------------|------------|----------|---------------------|----------------------|
| 模型数量 | 371+ | 19+ | 50+ | 不明 | **500+** |
| 实时数据 | ✅ API | ✅ 月更 | ✅ API | 定期 | **✅ 每日** |
| CNY 定价 | ❌ | ❌ | ✅ | ❌ | **✅** |
| USD 定价 | ✅ | ✅ | 部分 | ✅ | **✅** |
| 国内厂商 | 有限 | 有限 | ✅全 | ❌ | **✅ 12家** |
| 免费政策 | ✅ 标记 | ✅ 详细 | ✅ | ✅ 基础 | **✅ 详细追踪** |
| 性能评测 | ❌ | ❌ | ❌ | ✅ | **✅ 聚合** |
| 告警通知 | ❌ | ❌ | ❌ | ❌ | **✅** |
| 每日报告 | ❌ | ❌ | ❌ | ❌ | **✅** |
| 中文界面 | ❌ | ❌ | ✅ | ❌ | **✅** |
| Web 界面 | ✅ | ✅ | ✅ | ✅付费 | **✅** |
| MCP Server | ❌ | ❌ | ❌ | ❌ | **✅** |
---
## 六、竞品分析摘要
## 七、里程碑
| 竞品 | 覆盖 | 区域定价 | 免费政策 | 每日报告 | 中文 |
|------|------|----------|----------|----------|------|
| OpenRouter | 371 模型(海外为主)| ❌ | ✅ 标记 | ❌ | ❌ |
| Artificial Analysis | 性能排行 | ❌ | ✅ 基础 | ❌ | ❌ |
| truefoundry/models | 1000+ 配置YAML | ❌ | ❌ | ❌ | ❌ |
| 硅基流动 | 中转聚合 | ✅ CNY | ✅ 详细 | ❌ | ✅ |
| **本文产品(目标)** | **20+厂商 500+模型** | **✅ 双视图** | **✅ 详细** | **✅ 自动** | **✅** |
| Phase | 时间 | 目标 | 关键交付 |
|-------|------|------|----------|
| **Phase 1** | 2026-Q2 | MVP 上线 | 采集+存储+日报+Explorer |
| **Phase 2** | 2026-Q3 | 多数据源+告警 | 国内厂商采集+推送+趋势图 |
| **Phase 3** | 2026-Q4 | 商业化 | 订阅付费+API+MCP Server |
---
## 七、上线计划
## 八、术语表
| 阶段 | 内容 | 目标 | 工期 |
|------|------|------|------|
| **Phase 0** | PRD 确认 + 技术方案选定 | 1 周 | 2026-05 第1周 |
| **Phase 1** | OpenRouter 371 模型 + 10 主流国内厂商接入 + 静态报告 | 2 周 | 2026-05 第2-3周 |
| **Phase 2** | Web Dashboard + 告警 + 成本计算器 | 2 周 | 2026-05 第4周-6月第1周 |
| **Phase 3** | API 开放 + MCP Server + Agent 集成 | 1 周 | 2026-06 第2周 |
| 术语 | 定义 |
|------|------|
| MTok | Million Tokens百万 Token |
| Reseller | 中转聚合平台如硅基流动、OpenRouter |
| ELO | 模型质量评分系统OpenRouter 采用) |
| Context Length | 上下文窗口长度tokens |
| Free Tier | 免费额度层 |
| Capability | 模型能力(如 vision、function calling |
---
## 八、风险与依赖
## 九、参考链接
| 风险 | 影响 | 应对 |
|------|------|------|
| 国内厂商 API 变更/限速 | 采集失败 | 多源备份 + 人工补充机制 |
| 中转平台被墙/不稳定 | 数据不可用 | 标注平台稳定性评级 |
| 价格更新太频繁 | 报告滞后 | 变更触发实时告警,不等每日同步 |
| 数据版权问题 | 合规风险 | 仅采集公开数据,标注来源 |
### 8.1 数据来源
- OpenRouter API Docs: `https://openrouter.ai/docs`
- 硅基流动定价: `https://siliconflow.cn/pricing`
- AgentDeals.dev: `https://agentdeals.dev`
- Artificial Analysis: `https://artificialanalysis.ai`
---
## 九、用户故事
| # | 用户 | 故事 |
|---|------|------|
| U1 | 立立(研发) | "每天早上我花2分钟看报告知道今天哪个模型最值得用" |
| U2 | 小龙(项目经审) | "我想查'中文写作性价比最高的免费模型'5秒找到答案" |
| U3 | 宰相AI 助理) | "我想调用 API 自动为用户选择最优模型,不用每次问人" |
| U4 | 财务(成本管理) | "我想看到本月各模型花费占比,作为预算依据" |
| U5 | 项目经审(决策者) | "我想知道国内模型和国际模型的成本差异,辅助选型决策" |
---
## 十、附录
### 10.1 参考资料
- OpenRouter API: `https://openrouter.ai/api/v1/models`
- 硅基流动定价: `https://siliconflow.cn/zh-stilling/price`
- AWS Bedrock 定价: `https://aws.amazon.com/bedrock/pricing/`
- Azure OpenAI 定价: `https://azure.microsoft.com/en-us/pricing/details/cognitive-services/openai-service/`
### 8.2 厂商开放平台
- OpenAI: `https://platform.openai.com/pricing`
- Anthropic: `https://console.anthropic.com`
- 百度 ERNIE: `https://qianfan.llm.yundun.cn/`
- 阿里 DashScope: `https://help.aliyun.com/zh/dashscope/`
- DeepSeek: `https://platform.deepseek.com/`
### 10.2 数据字典(核心字段)
### 8.3 数据字典(核心字段)
| 字段 | 类型 | 说明 | 示例 |
|------|------|------|------|
@@ -370,3 +368,15 @@ LLM Intelligence Hub
| free_tier | text | 免费额度描述 | "每日100次每次不超过4000 tokens" |
| context_length | int | 上下文窗口 | 128000 |
| capabilities | array | 能力列表 | ["vision","function_calling"] |
---
## 十一、数据质量与血缘
**六、数据质量与血缘**
- 数据校验规则价格不能为负、context_length 不能超过 10M、currency 必须为 CNY/USD/EUR 之一
- 数据新鲜度指标:每条记录标注 `retrieved_at`,超过 24h 标记为 stale
- 数据血缘追踪:每条价格记录记录来源 API URL、采集批次号、采集器版本
- 质量分级official官方API/ inferred推导/ unverified未验证/ stale过期
- 自动清洗:采集失败时保留上次成功数据,标记 "data_stale_until_next_run"
- 质量报告:每日报告包含数据质量摘要(覆盖率/新鲜度/异常数)