# LLM Intelligence Hub — 功能清单(Feature List) > 文档版本:v1.1 > 日期:2026-05-09 > 状态:Phase 1 已冻结,与 PRD v0.3 / TECH v1.1 对齐 --- ## 一、功能总览 按用户场景分为五大模块: | 模块 | 核心能力 | 对应功能 | |------|----------|----------| | **追踪(Track)** | 实时掌握模型动态 | F1 数据采集、F2 模型基础库、F3 定价库、F4 免费政策库 | | **查询(Query)** | 快速找到目标信息 | F6 搜索与筛选、F7 成本计算器 | | **分析(Analyze)** | 深度理解数据 | F9 模型评测聚合、F11 趋势分析 | | **报告(Report)** | 自动化输出 | F5 每日自动报告生成、F12 历史对比 | | **订阅(Subscribe)** | 实时通知 | F8 价格变动告警、F13 订阅与推送 | --- ## 二、功能详细描述 ### 2.1 追踪模块(Track) --- #### F1:多源数据采集引擎 - **功能名称**:多源数据采集引擎 - **一句话描述**:自动从 OpenRouter 同步模型与定价数据(Phase 1 单数据源) - **用户故事**:作为系统,我希望每日自动从 OpenRouter 采集最新模型信息,无需人工维护 - **功能优先级**:P0 - **Phase 归属**:Phase 1 - **技术依赖**:OpenRouter API(371+ 海外模型) - **验收标准**: - [ ] OpenRouter 371+ 模型入库 - [ ] 每日可重复采集 - [ ] 采集失败写入日志,保留上次成功数据 - [ ] 每条数据标注来源 URL 和置信度 --- #### F2:模型基础信息库 - **功能名称**:模型基础信息库 - **一句话描述**:存储所有模型的元数据(名称/版本/厂商/模态/上下文/能力/状态) - **用户故事**:作为用户,我想查询某个模型的发布时间、上下文窗口、支持的 capabilities,无需跳转到多个官网 - **功能优先级**:P0 - **Phase 归属**:Phase 1 - **技术依赖**:F1 数据采集引擎;PostgreSQL Schema `model_provider` / `model` - **验收标准**: - [ ] 字段完整率 > 95%(名称/版本/模态/context_length/capabilities/status) - [ ] 支持按厂商/模态/状态筛选 - [ ] 模型状态变更自动追踪(active → deprecated → discontinued) --- #### F3:区域定价数据库 - **功能名称**:区域定价数据库 - **一句话描述**:存储所有运营商 × 模型 × 区域的完整定价,支持 USD/CNY/EUR 换算与历史追踪 - **用户故事**:作为用户,我想比较"DeepSeek V4-Flash 在阿里云和硅基流动的 CNY 价格差异",一目了然 - **功能优先级**:P0 - **Phase 归属**:Phase 1 - **技术依赖**:F1 数据采集引擎;PostgreSQL Schema `operator` / `region_pricing` / `pricing_change` - **验收标准**: - [ ] 支持 CNY/USD 双视图,汇率自动更新 - [ ] 价格变动记录保留历史,支持趋势查看 - [ ] 每条价格标注来源 URL,标注数据质量(官方/推测/已过期) --- #### F4:免费政策库 - **功能名称**:免费政策库 - **一句话描述**:汇总所有平台的免费模型、免费额度、限流规则与区域限制 - **用户故事**:作为小龙,我想查"中文写作性价比最高的免费模型",5秒内找到答案 - **功能优先级**:P1 - **Phase 归属**:Phase 2 - **技术依赖**:F1 数据采集引擎(多数据源扩充后);PostgreSQL Schema `free_tier` - **验收标准**: - [ ] 覆盖 20+ 平台的免费政策 - [ ] 包含:免费模型列表、每日/每月请求上限、Token 上限、QPS 限制、区域限制 - [ ] 支持筛选:完全免费 / 限流免费 / 仅新用户 --- #### F11:趋势分析 - **功能名称**:趋势分析 - **一句话描述**:基于历史价格数据生成趋势图,支持周/月维度对比 - **用户故事**:作为项目经审,我想看"过去3个月 Kimi K2 的价格走势",辅助选型决策 - **功能优先级**:P1 - **Phase 归属**:Phase 2 - **技术依赖**:F3 定价数据库;时序数据库(TimescaleDB);图表库(ECharts) - **验收标准**: - [ ] 支持 7d / 30d / 90d 趋势视图 - [ ] 支持多模型横向对比 - [ ] 支持价格变动时间线标注 --- ### 2.2 查询模块(Query) --- #### F6:搜索与筛选 - **功能名称**:搜索与筛选 - **一句话描述**:支持按厂商/模态/场景/价格区间/上下文长度/免费/付费的组合筛选与关键词搜索 - **用户故事**:作为立立,我想查"支持 function calling、上下文超过 100K、输入价格低于 ¥0.5 的免费模型" - **功能优先级**:P0 - **Phase 归属**:Phase 1 - **技术依赖**:PostgreSQL 全文检索;前端筛选组件 - **验收标准**: - [ ] 支持多条件组合筛选(厂商 + 模态 + 价格 + 上下文 + 免费) - [ ] 支持关键词搜索(模型名/厂商名/特性) - [ ] 支持卡片视图 / 表格视图切换 - [ ] 搜索结果 < 500ms 响应 --- #### F7:成本计算器 - **功能名称**:成本计算器 - **一句话描述**:输入 Token 数量(输入/输出分开),输出各平台成本对比排行榜,支持按月用量估算 - **用户故事**:作为财务,我想知道"月均 1000 万输入 + 500 万输出 tokens,各平台成本是多少" - **功能优先级**:P1 - **Phase 归属**:Phase 2 - **技术依赖**:F3 定价数据库;前端计算组件 - **验收标准**: - [ ] 支持输入/输出 Token 分开计费 - [ ] 输出按成本升序排列的对比表 - [ ] 支持按月用量估算(1M / 10M / 100M / 自定义) - [ ] 支持货币切换(CNY/USD) --- ### 2.3 分析模块(Analyze) --- #### F9:模型评测聚合 - **功能名称**:模型评测聚合 - **一句话描述**:汇总 MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等权威基准分,按场景排名 - **用户故事**:作为立立,我想知道"编码能力最强的开源模型是哪个",参考评测数据做选型 - **功能优先级**:P1 - **Phase 归属**:Phase 2 - **技术依赖**:评测数据源(PapersWithCode / LM Arena);评测数据库 Schema - **验收标准**: - [ ] 覆盖 6+ 主流基准(MMLU / HumanEval / GSM8K / MATH / LiveCodeBench / SWE-Bench) - [ ] 支持按场景排序(编码/推理/写作/免费) - [ ] 评测数据标注来源和测试日期 --- ### 2.4 报告模块(Report) --- #### F5:每日自动报告生成 - **功能名称**:每日自动报告生成 - **一句话描述**:每日 08:00 自动生成 Web 页面报告,包含新模型、价格变动、免费政策变更、场景推荐 - **用户故事**:作为用户,我希望每天早上花2分钟看完报告,知道今天哪个模型最值得用 - **功能优先级**:P0 - **Phase 归属**:Phase 1 - **技术依赖**:F1/F2/F3 数据基础;Cron 调度;Markdown 输出 - **验收标准**: - [ ] 每日 08:00 定时触发,报告生成 < 30 秒 - [ ] 报告内容:新模型上线、价格变动(>5% 高亮)、场景推荐 - [ ] Markdown 文件输出到 reports/daily/ 目录 - [ ] 报告命令可手动重放 --- #### F12:历史对比 - **功能名称**:历史对比 - **一句话描述**:支持历史报告与当前数据对比,查看模型上线/价格变化/下线的历史时间线 - **用户故事**:作为项目经审,我想看"GPT-5.4 发布前后,同类模型价格变化对比" - **功能优先级**:P2 - **Phase 归属**:Phase 2 - **技术依赖**:F5 每日报告;`daily_report` 表;历史数据存储 - **验收标准**: - [ ] 支持报告版本对比(任意两天报告差异) - [ ] 支持模型/价格/免费政策的历史时间线 - [ ] 支持导出对比报告(HTML/PDF) --- ### 2.5 订阅模块(Subscribe) --- #### F8:价格变动告警 - **功能名称**:价格变动告警 - **一句话描述**:当模型价格变动超过阈值(默认 10%),自动推送告警至钉钉/飞书/Email - **用户故事**:作为用户,我关注 DeepSeek V4-Flash,当价格涨跌超过 10% 时希望立即知道 - **功能优先级**:P1 - **Phase 归属**:Phase 2 - **技术依赖**:F3 定价数据库;变更检测逻辑;钉钉/飞书/Email 集成 - **验收标准**: - [ ] 可配置阈值(默认 10%,支持 5%/15%/20%) - [ ] 支持白名单(关注特定模型/平台) - [ ] 告警内容包含:模型名、原价、新价、变动幅度、来源链接 - [ ] 支持钉钉群/飞书群/Email 三种推送方式 --- #### F13:订阅与推送 - **功能名称**:订阅与推送 - **一句话描述**:用户可订阅关注特定厂商/模型/场景,支持按订阅条件推送定制化报告 - **用户故事**:作为用户,我只关心 DeepSeek 和 Kimi,想只收到这两个厂商的价格变动通知 - **功能优先级**:P2 - **Phase 归属**:Phase 2 - **技术依赖**:F8 告警系统;订阅管理 Schema;用户偏好存储 - **验收标准**: - [ ] 支持按厂商/模型/场景订阅 - [ ] 支持推送频率配置(实时/每日/每周汇总) - [ ] 支持 Email / 钉钉 / 飞书 三种接收渠道 --- ### 2.6 进阶功能(Should Have / Could Have) --- #### F10:API 接口 - **功能名称**:API 接口 - **一句话描述**:提供 JSON API 供 AI Agent 查询最优模型,支持 MCP Server 集成 - **用户故事**:作为宰相(AI 助理),我想调用 API 自动为用户选择最优模型,不用每次问人 - **功能优先级**:P0 - **Phase 归属**:Phase 2 - **技术依赖**:REST API 框架(FastAPI/Flask);MCP Server 实现 - **验收标准**: - [ ] 提供 `/models` 查询接口(按模态/价格/场景过滤) - [ ] 提供 `/cost` 计算接口(输入/输出 Token 计算成本) - [ ] 提供 `/recommend` 推荐接口(输入场景,输出最优模型列表) - [ ] MCP Server 支持 OpenClaw / Claude Code 集成 - [ ] API 响应 < 500ms --- ## 三、优先级矩阵 | 功能 ID | 功能名称 | P0 | P1 | P2 | Phase 1 | Phase 2 | |---------|----------|----|----|----|---------|---------| | F1 | 多源数据采集引擎 | ✅ | | | ✅ | | | F2 | 模型基础信息库 | ✅ | | | ✅ | | | F3 | 区域定价数据库 | ✅ | | | ✅ | | | F6 | 搜索与筛选 | ✅ | | | ✅ | | | F5 | 每日自动报告生成 | ✅ | | | ✅ | | | F4 | 免费政策库 | | ✅ | | | ✅ | | F7 | 成本计算器 | | ✅ | | | ✅ | | F9 | 模型评测聚合 | | ✅ | | | ✅ | | F8 | 价格变动告警 | | ✅ | | | ✅ | | F11 | 趋势分析 | | ✅ | | | ✅ | | F10 | API 接口 | | ✅ | | | ✅ | | F12 | 历史对比 | | | ✅ | | ✅ | | F13 | 订阅与推送 | | | ✅ | | ✅ | ### P0 × Phase 1 核心功能栅格 ``` Phase 1 MVP 核心功能(P0): ┌─────────────────────────────────────────────────────┐ │ F1 多源数据采集引擎 │ │ F2 模型基础信息库 │ │ F3 区域定价数据库 │ │ F6 搜索与筛选 │ │ F5 每日自动报告生成 │ └─────────────────────────────────────────────────────┘ + P1 提升(Phase 1 纳入): F4 免费政策库 → Phase 2(多数据源扩充后) ``` --- ## 四、Phase 1 MVP 定义 **目标**:上线一个可用的 LLM 情报追踪系统,覆盖 20+ 厂商、500+ 模型,每日自动生成中文报告。 ### MVP 功能清单(≤10 个 P0 功能 + 必要 P1) | # | 功能 ID | 功能名称 | 优先级 | 验收条件 | |---|---------|----------|--------|----------| | 1 | F1 | OpenRouter 采集器 | P0 | 从 OpenRouter 自动同步 371+ 模型数据 | | 2 | F2 | 模型基础信息库 | P0 | 模型元数据完整(名称/版本/模态/context/capabilities),支持筛选 | | 3 | F3 | 区域定价数据库 | P0 | CNY/USD 双视图,保留历史价格,支持趋势查看 | | 4 | F6 | 搜索与筛选 | P0 | 组合筛选(厂商+模态+价格+上下文+免费),< 500ms 响应 | | 5 | F5 | 每日自动报告生成 | P0 | 每日 08:00 触发,生成 HTML 报告(新模型/价格变动/场景推荐) | | 6 | — | PostgreSQL 数据库 | P0 | models/model_prices/report_runs 三张表,失败日志 | | 7 | — | 中文界面 | P0 | 100% 汉化,前端界面友好 | | 8 | — | Explorer 页面 | P0 | 模型表格、筛选、排序、免费标记 | | 9 | — | Dashboard 占位图 | P0 | 价格趋势占位图,数据来自日报生成命令可重放 | **MVP 不包含**:F4 免费政策库(Phase 1 P1,非 MVP)、成本计算器(F7)、评测聚合(F9)、告警(F8)、API 接口(F10)、趋势分析(F11)、历史对比(F12)、订阅(F13)。 --- ## 五、非功能需求 ### 5.1 数据准确性 | 指标 | 要求 | |------|------| | 数据来源标注 | 每条数据必须标注来源 URL,可溯源 | | 置信度分级 | 官方确认 / 文档推断 / 待核实,三级标注 | | 更新标记 | 过期数据标记"已失效",保留历史记录 | | 价格校验 | 同模型多源价格差异 > 20% 时告警并标注"待核实" | | 错误处理 | 采集失败写入日志,保留上次成功数据,不覆盖旧数据 | ### 5.2 更新频率 | 数据类型 | 更新频率 | 触发方式 | |----------|----------|----------| | 海外模型(OpenRouter) | 每日同步 | 每日 08:00 cron | | 国内厂商定价 | 每日同步 | 每日 08:00 cron | | 中转平台定价 | 每日同步 | 每日 08:00 cron | | 免费政策变更 | 变更触发 | 采集时检测到变化立即更新 | | 价格变动 > 10% | 变更触发 | 实时检测,触发告警 | | 模型状态变更(active/deprecated) | 变更触发 | 检测到状态变化立即更新 | ### 5.3 可用性要求 | 指标 | 要求 | |------|------| | 系统可用性 | 99.5%(每月停机 < 3.6 小时) | | 报告生成 | < 30 秒(从触发到 HTML 输出) | | API 响应 | < 500ms(/models 查询接口) | | 数据采集成功率 | > 95%(每日采集成功率) | | 故障恢复 | 采集失败连续 3 天触发告警;数据库每日备份 | | 日志留存 | 30 天 | ### 5.4 技术约束 | 指标 | 要求 | |------|------| | 部署方式 | Docker,支持内网部署 | | 数据库 | PostgreSQL(主)+ TimescaleDB(时序)/ SQLite(轻量版) | | 存储估算 | 500+ 模型 × 50 字段 ≈ 100MB,每日增量 ~1MB | | 备份策略 | 数据库每日全量备份,保留 30 天 | --- ## 六、功能依赖关系图 ``` 数据层(采集) F1 多源数据采集引擎 ↓ 采集数据 ┌─────────────────────────────────┐ │ │ ↓ ↓ F2 模型基础信息库 F3 区域定价数据库 (Model 表) (RegionPricing 表) ↓ ↓ F4 免费政策库 F11 趋势分析 ↓ (依赖 F3 历史数据) ↓ ┌──────────┬──────────┬──────────┐ ↓ ↓ ↓ ↓ F6 搜索筛选 F5 报告生成 F9 评测聚合 F7 成本计算器 ↓ ↓ ↓ ↓ └──────────┴──────────┴──────────┘ ↓ F8 价格变动告警 F10 API 接口 F12 历史对比 F13 订阅与推送 ``` --- ## 七、Phase 2 功能概览 Phase 2 在 Phase 1 数据基础上构建增值能力: | 功能 | 描述 | 差异化价值 | |------|------|-----------| | F7 成本计算器 | Token 用量成本对比 | 与竞品(硅基流动/AgentDeals)拉开差距的核心功能 | | F9 模型评测聚合 | 基准分排行 | 参考 Artificial Analysis,但聚合中文可用数据 | | F8 价格变动告警 | >10% 变动实时推送 | OpenRouter/硅基流动均无此功能 | | F11 趋势分析 | 历史价格趋势图 | AgentDeals 有部分功能,但无中文界面和 CNY 视图 | | F10 API 接口 | JSON API + MCP Server | 竞品均无 —— 差异化核心,AI Agent 集成入口 | | F12 历史对比 | 报告版本对比 | 独有功能,增强数据价值 | | F13 订阅与推送 | 定制化订阅 | 提升用户粘性,与钉钉/飞书深度集成 | --- **文档状态**:初稿完成,待评审 --- *最后更新:2026-05-04 by 宰相(AI 辅助)* --- ## 三、容错与降级设计 每个功能必须包含降级策略: - F1 采集器失败:前端显示上次成功数据 + stale 标记 + 人工检查入口 - F2 模型库查询失败:返回缓存快照,提示"数据可能不是最新" - F3 定价库缺失:显示 "pricing unavailable" 而非空白或 0 - F5 日报生成失败:保留上日报,标题加 "[数据延迟]" - F6 搜索失败:降级为简单列表展示,保留筛选框 - 全局降级开关:维护模式页面,提示服务状态