Files
llm-intelligence/FEATURE_LIST.md

417 lines
17 KiB
Markdown
Raw Normal View History

# LLM Intelligence Hub — 功能清单Feature List
> 文档版本v1.1
> 日期2026-05-09
> 状态Phase 1 已冻结,与 PRD v0.3 / TECH v1.1 对齐
---
## 一、功能总览
按用户场景分为五大模块:
| 模块 | 核心能力 | 对应功能 |
|------|----------|----------|
| **追踪Track** | 实时掌握模型动态 | F1 数据采集、F2 模型基础库、F3 定价库、F4 免费政策库 |
| **查询Query** | 快速找到目标信息 | F6 搜索与筛选、F7 成本计算器 |
| **分析Analyze** | 深度理解数据 | F9 模型评测聚合、F11 趋势分析 |
| **报告Report** | 自动化输出 | F5 每日自动报告生成、F12 历史对比 |
| **订阅Subscribe** | 实时通知 | F8 价格变动告警、F13 订阅与推送 |
---
## 二、功能详细描述
### 2.1 追踪模块Track
---
#### F1多源数据采集引擎
- **功能名称**:多源数据采集引擎
- **一句话描述**:自动从 OpenRouter 同步模型与定价数据Phase 1 单数据源)
- **用户故事**:作为系统,我希望每日自动从 OpenRouter 采集最新模型信息,无需人工维护
- **功能优先级**P0
- **Phase 归属**Phase 1
- **技术依赖**OpenRouter API371+ 海外模型)
- **验收标准**
- [ ] OpenRouter 371+ 模型入库
- [ ] 每日可重复采集
- [ ] 采集失败写入日志,保留上次成功数据
- [ ] 每条数据标注来源 URL 和置信度
---
#### F2模型基础信息库
- **功能名称**:模型基础信息库
- **一句话描述**:存储所有模型的元数据(名称/版本/厂商/模态/上下文/能力/状态)
- **用户故事**:作为用户,我想查询某个模型的发布时间、上下文窗口、支持的 capabilities无需跳转到多个官网
- **功能优先级**P0
- **Phase 归属**Phase 1
- **技术依赖**F1 数据采集引擎PostgreSQL Schema `model_provider` / `model`
- **验收标准**
- [ ] 字段完整率 > 95%(名称/版本/模态/context_length/capabilities/status
- [ ] 支持按厂商/模态/状态筛选
- [ ] 模型状态变更自动追踪active → deprecated → discontinued
---
#### F3区域定价数据库
- **功能名称**:区域定价数据库
- **一句话描述**:存储所有运营商 × 模型 × 区域的完整定价,支持 USD/CNY/EUR 换算与历史追踪
- **用户故事**:作为用户,我想比较"DeepSeek V4-Flash 在阿里云和硅基流动的 CNY 价格差异",一目了然
- **功能优先级**P0
- **Phase 归属**Phase 1
- **技术依赖**F1 数据采集引擎PostgreSQL Schema `operator` / `region_pricing` / `pricing_change`
- **验收标准**
- [ ] 支持 CNY/USD 双视图,汇率自动更新
- [ ] 价格变动记录保留历史,支持趋势查看
- [ ] 每条价格标注来源 URL标注数据质量官方/推测/已过期)
---
#### F4免费政策库
- **功能名称**:免费政策库
- **一句话描述**:汇总所有平台的免费模型、免费额度、限流规则与区域限制
- **用户故事**:作为小龙,我想查"中文写作性价比最高的免费模型"5秒内找到答案
- **功能优先级**P1
- **Phase 归属**Phase 2
- **技术依赖**F1 数据采集引擎多数据源扩充后PostgreSQL Schema `free_tier`
- **验收标准**
- [ ] 覆盖 20+ 平台的免费政策
- [ ] 包含:免费模型列表、每日/每月请求上限、Token 上限、QPS 限制、区域限制
- [ ] 支持筛选:完全免费 / 限流免费 / 仅新用户
---
#### F11趋势分析
- **功能名称**:趋势分析
- **一句话描述**:基于历史价格数据生成趋势图,支持周/月维度对比
- **用户故事**:作为项目经审,我想看"过去3个月 Kimi K2 的价格走势",辅助选型决策
- **功能优先级**P1
- **Phase 归属**Phase 2
- **技术依赖**F3 定价数据库时序数据库TimescaleDB图表库ECharts
- **验收标准**
- [ ] 支持 7d / 30d / 90d 趋势视图
- [ ] 支持多模型横向对比
- [ ] 支持价格变动时间线标注
---
### 2.2 查询模块Query
---
#### F6搜索与筛选
- **功能名称**:搜索与筛选
- **一句话描述**:支持按厂商/模态/场景/价格区间/上下文长度/免费/付费的组合筛选与关键词搜索
- **用户故事**:作为立立,我想查"支持 function calling、上下文超过 100K、输入价格低于 ¥0.5 的免费模型"
- **功能优先级**P0
- **Phase 归属**Phase 1
- **技术依赖**PostgreSQL 全文检索;前端筛选组件
- **验收标准**
- [ ] 支持多条件组合筛选(厂商 + 模态 + 价格 + 上下文 + 免费)
- [ ] 支持关键词搜索(模型名/厂商名/特性)
- [ ] 支持卡片视图 / 表格视图切换
- [ ] 搜索结果 < 500ms 响应
---
#### F7成本计算器
- **功能名称**:成本计算器
- **一句话描述**:输入 Token 数量(输入/输出分开),输出各平台成本对比排行榜,支持按月用量估算
- **用户故事**:作为财务,我想知道"月均 1000 万输入 + 500 万输出 tokens各平台成本是多少"
- **功能优先级**P1
- **Phase 归属**Phase 2
- **技术依赖**F3 定价数据库;前端计算组件
- **验收标准**
- [ ] 支持输入/输出 Token 分开计费
- [ ] 输出按成本升序排列的对比表
- [ ] 支持按月用量估算1M / 10M / 100M / 自定义)
- [ ] 支持货币切换CNY/USD
---
### 2.3 分析模块Analyze
---
#### F9模型评测聚合
- **功能名称**:模型评测聚合
- **一句话描述**:汇总 MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等权威基准分,按场景排名
- **用户故事**:作为立立,我想知道"编码能力最强的开源模型是哪个",参考评测数据做选型
- **功能优先级**P1
- **Phase 归属**Phase 2
- **技术依赖**评测数据源PapersWithCode / LM Arena评测数据库 Schema
- **验收标准**
- [ ] 覆盖 6+ 主流基准MMLU / HumanEval / GSM8K / MATH / LiveCodeBench / SWE-Bench
- [ ] 支持按场景排序(编码/推理/写作/免费)
- [ ] 评测数据标注来源和测试日期
---
### 2.4 报告模块Report
---
#### F5每日自动报告生成
- **功能名称**:每日自动报告生成
- **一句话描述**:每日 08:00 自动生成 Web 页面报告,包含新模型、价格变动、免费政策变更、场景推荐
- **用户故事**作为用户我希望每天早上花2分钟看完报告知道今天哪个模型最值得用
- **功能优先级**P0
- **Phase 归属**Phase 1
- **技术依赖**F1/F2/F3 数据基础Cron 调度Markdown 输出
- **验收标准**
- [ ] 每日 08:00 定时触发,报告生成 < 30 秒
- [ ] 报告内容:新模型上线、价格变动(>5% 高亮)、场景推荐
- [ ] Markdown 文件输出到 reports/daily/ 目录
- [ ] 报告命令可手动重放
---
#### F12历史对比
- **功能名称**:历史对比
- **一句话描述**:支持历史报告与当前数据对比,查看模型上线/价格变化/下线的历史时间线
- **用户故事**:作为项目经审,我想看"GPT-5.4 发布前后,同类模型价格变化对比"
- **功能优先级**P2
- **Phase 归属**Phase 2
- **技术依赖**F5 每日报告;`daily_report` 表;历史数据存储
- **验收标准**
- [ ] 支持报告版本对比(任意两天报告差异)
- [ ] 支持模型/价格/免费政策的历史时间线
- [ ] 支持导出对比报告HTML/PDF
---
### 2.5 订阅模块Subscribe
---
#### F8价格变动告警
- **功能名称**:价格变动告警
- **一句话描述**:当模型价格变动超过阈值(默认 10%),自动推送告警至钉钉/飞书/Email
- **用户故事**:作为用户,我关注 DeepSeek V4-Flash当价格涨跌超过 10% 时希望立即知道
- **功能优先级**P1
- **Phase 归属**Phase 2
- **技术依赖**F3 定价数据库;变更检测逻辑;钉钉/飞书/Email 集成
- **验收标准**
- [ ] 可配置阈值(默认 10%,支持 5%/15%/20%
- [ ] 支持白名单(关注特定模型/平台)
- [ ] 告警内容包含:模型名、原价、新价、变动幅度、来源链接
- [ ] 支持钉钉群/飞书群/Email 三种推送方式
---
#### F13订阅与推送
- **功能名称**:订阅与推送
- **一句话描述**:用户可订阅关注特定厂商/模型/场景,支持按订阅条件推送定制化报告
- **用户故事**:作为用户,我只关心 DeepSeek 和 Kimi想只收到这两个厂商的价格变动通知
- **功能优先级**P2
- **Phase 归属**Phase 2
- **技术依赖**F8 告警系统;订阅管理 Schema用户偏好存储
- **验收标准**
- [ ] 支持按厂商/模型/场景订阅
- [ ] 支持推送频率配置(实时/每日/每周汇总)
- [ ] 支持 Email / 钉钉 / 飞书 三种接收渠道
---
### 2.6 进阶功能Should Have / Could Have
---
#### F10API 接口
- **功能名称**API 接口
- **一句话描述**:提供 JSON API 供 AI Agent 查询最优模型,支持 MCP Server 集成
- **用户故事**作为宰相AI 助理),我想调用 API 自动为用户选择最优模型,不用每次问人
- **功能优先级**P0
- **Phase 归属**Phase 2
- **技术依赖**REST API 框架FastAPI/FlaskMCP Server 实现
- **验收标准**
- [ ] 提供 `/models` 查询接口(按模态/价格/场景过滤)
- [ ] 提供 `/cost` 计算接口(输入/输出 Token 计算成本)
- [ ] 提供 `/recommend` 推荐接口(输入场景,输出最优模型列表)
- [ ] MCP Server 支持 OpenClaw / Claude Code 集成
- [ ] API 响应 < 500ms
---
## 三、优先级矩阵
| 功能 ID | 功能名称 | P0 | P1 | P2 | Phase 1 | Phase 2 |
|---------|----------|----|----|----|---------|---------|
| F1 | 多源数据采集引擎 | ✅ | | | ✅ | |
| F2 | 模型基础信息库 | ✅ | | | ✅ | |
| F3 | 区域定价数据库 | ✅ | | | ✅ | |
| F6 | 搜索与筛选 | ✅ | | | ✅ | |
| F5 | 每日自动报告生成 | ✅ | | | ✅ | |
| F4 | 免费政策库 | | ✅ | | | ✅ |
| F7 | 成本计算器 | | ✅ | | | ✅ |
| F9 | 模型评测聚合 | | ✅ | | | ✅ |
| F8 | 价格变动告警 | | ✅ | | | ✅ |
| F11 | 趋势分析 | | ✅ | | | ✅ |
| F10 | API 接口 | | ✅ | | | ✅ |
| F12 | 历史对比 | | | ✅ | | ✅ |
| F13 | 订阅与推送 | | | ✅ | | ✅ |
### P0 × Phase 1 核心功能栅格
```
Phase 1 MVP 核心功能P0
┌─────────────────────────────────────────────────────┐
│ F1 多源数据采集引擎 │
│ F2 模型基础信息库 │
│ F3 区域定价数据库 │
│ F6 搜索与筛选 │
│ F5 每日自动报告生成 │
└─────────────────────────────────────────────────────┘
+ P1 提升Phase 1 纳入):
F4 免费政策库 → Phase 2多数据源扩充后
```
---
## 四、Phase 1 MVP 定义
**目标**:上线一个可用的 LLM 情报追踪系统,覆盖 20+ 厂商、500+ 模型,每日自动生成中文报告。
### MVP 功能清单≤10 个 P0 功能 + 必要 P1
| # | 功能 ID | 功能名称 | 优先级 | 验收条件 |
|---|---------|----------|--------|----------|
| 1 | F1 | OpenRouter 采集器 | P0 | 从 OpenRouter 自动同步 371+ 模型数据 |
| 2 | F2 | 模型基础信息库 | P0 | 模型元数据完整(名称/版本/模态/context/capabilities支持筛选 |
| 3 | F3 | 区域定价数据库 | P0 | CNY/USD 双视图,保留历史价格,支持趋势查看 |
| 4 | F6 | 搜索与筛选 | P0 | 组合筛选(厂商+模态+价格+上下文+免费),< 500ms 响应 |
| 5 | F5 | 每日自动报告生成 | P0 | 每日 08:00 触发,生成 HTML 报告(新模型/价格变动/场景推荐) |
| 6 | — | PostgreSQL 数据库 | P0 | models/model_prices/report_runs 三张表,失败日志 |
| 7 | — | 中文界面 | P0 | 100% 汉化,前端界面友好 |
| 8 | — | Explorer 页面 | P0 | 模型表格、筛选、排序、免费标记 |
| 9 | — | Dashboard 占位图 | P0 | 价格趋势占位图,数据来自日报生成命令可重放 |
**MVP 不包含**F4 免费政策库Phase 1 P1非 MVP、成本计算器F7、评测聚合F9、告警F8、API 接口F10、趋势分析F11、历史对比F12、订阅F13
---
## 五、非功能需求
### 5.1 数据准确性
| 指标 | 要求 |
|------|------|
| 数据来源标注 | 每条数据必须标注来源 URL可溯源 |
| 置信度分级 | 官方确认 / 文档推断 / 待核实,三级标注 |
| 更新标记 | 过期数据标记"已失效",保留历史记录 |
| 价格校验 | 同模型多源价格差异 > 20% 时告警并标注"待核实" |
| 错误处理 | 采集失败写入日志,保留上次成功数据,不覆盖旧数据 |
### 5.2 更新频率
| 数据类型 | 更新频率 | 触发方式 |
|----------|----------|----------|
| 海外模型OpenRouter | 每日同步 | 每日 08:00 cron |
| 国内厂商定价 | 每日同步 | 每日 08:00 cron |
| 中转平台定价 | 每日同步 | 每日 08:00 cron |
| 免费政策变更 | 变更触发 | 采集时检测到变化立即更新 |
| 价格变动 > 10% | 变更触发 | 实时检测,触发告警 |
| 模型状态变更active/deprecated | 变更触发 | 检测到状态变化立即更新 |
### 5.3 可用性要求
| 指标 | 要求 |
|------|------|
| 系统可用性 | 99.5%(每月停机 < 3.6 小时) |
| 报告生成 | < 30 秒(从触发到 HTML 输出) |
| API 响应 | < 500ms/models 查询接口) |
| 数据采集成功率 | > 95%(每日采集成功率) |
| 故障恢复 | 采集失败连续 3 天触发告警;数据库每日备份 |
| 日志留存 | 30 天 |
### 5.4 技术约束
| 指标 | 要求 |
|------|------|
| 部署方式 | Docker支持内网部署 |
| 数据库 | PostgreSQL+ TimescaleDB时序/ SQLite轻量版 |
| 存储估算 | 500+ 模型 × 50 字段 ≈ 100MB每日增量 ~1MB |
| 备份策略 | 数据库每日全量备份,保留 30 天 |
---
## 六、功能依赖关系图
```
数据层(采集)
F1 多源数据采集引擎
↓ 采集数据
┌─────────────────────────────────┐
│ │
↓ ↓
F2 模型基础信息库 F3 区域定价数据库
(Model 表) (RegionPricing 表)
↓ ↓
F4 免费政策库 F11 趋势分析
↓ (依赖 F3 历史数据)
┌──────────┬──────────┬──────────┐
↓ ↓ ↓ ↓
F6 搜索筛选 F5 报告生成 F9 评测聚合 F7 成本计算器
↓ ↓ ↓ ↓
└──────────┴──────────┴──────────┘
F8 价格变动告警
F10 API 接口
F12 历史对比
F13 订阅与推送
```
---
## 七、Phase 2 功能概览
Phase 2 在 Phase 1 数据基础上构建增值能力:
| 功能 | 描述 | 差异化价值 |
|------|------|-----------|
| F7 成本计算器 | Token 用量成本对比 | 与竞品(硅基流动/AgentDeals拉开差距的核心功能 |
| F9 模型评测聚合 | 基准分排行 | 参考 Artificial Analysis但聚合中文可用数据 |
| F8 价格变动告警 | >10% 变动实时推送 | OpenRouter/硅基流动均无此功能 |
| F11 趋势分析 | 历史价格趋势图 | AgentDeals 有部分功能,但无中文界面和 CNY 视图 |
| F10 API 接口 | JSON API + MCP Server | 竞品均无 —— 差异化核心AI Agent 集成入口 |
| F12 历史对比 | 报告版本对比 | 独有功能,增强数据价值 |
| F13 订阅与推送 | 定制化订阅 | 提升用户粘性,与钉钉/飞书深度集成 |
---
**文档状态**:初稿完成,待评审
---
*最后更新2026-05-04 by 宰相AI 辅助)*
---
## 三、容错与降级设计
每个功能必须包含降级策略:
- F1 采集器失败:前端显示上次成功数据 + stale 标记 + 人工检查入口
- F2 模型库查询失败:返回缓存快照,提示"数据可能不是最新"
- F3 定价库缺失:显示 "pricing unavailable" 而非空白或 0
- F5 日报生成失败:保留上日报,标题加 "[数据延迟]"
- F6 搜索失败:降级为简单列表展示,保留筛选框
- 全局降级开关:维护模式页面,提示服务状态