Files
llm-intelligence/FEATURE_LIST.md
phamnazage-jpg 77e6610fd2
Some checks failed
CI / test (push) Has been cancelled
chore: prepare repository for publishing
2026-05-13 14:42:45 +08:00

17 KiB
Raw Permalink Blame History

LLM Intelligence Hub — 功能清单Feature List

文档版本v1.1 日期2026-05-09 状态Phase 1 已冻结,与 PRD v0.3 / TECH v1.1 对齐


一、功能总览

按用户场景分为五大模块:

模块 核心能力 对应功能
追踪Track 实时掌握模型动态 F1 数据采集、F2 模型基础库、F3 定价库、F4 免费政策库
查询Query 快速找到目标信息 F6 搜索与筛选、F7 成本计算器
分析Analyze 深度理解数据 F9 模型评测聚合、F11 趋势分析
报告Report 自动化输出 F5 每日自动报告生成、F12 历史对比
订阅Subscribe 实时通知 F8 价格变动告警、F13 订阅与推送

二、功能详细描述

2.1 追踪模块Track


F1多源数据采集引擎

  • 功能名称:多源数据采集引擎
  • 一句话描述:自动从 OpenRouter 同步模型与定价数据Phase 1 单数据源)
  • 用户故事:作为系统,我希望每日自动从 OpenRouter 采集最新模型信息,无需人工维护
  • 功能优先级P0
  • Phase 归属Phase 1
  • 技术依赖OpenRouter API371+ 海外模型)
  • 验收标准
    • OpenRouter 371+ 模型入库
    • 每日可重复采集
    • 采集失败写入日志,保留上次成功数据
    • 每条数据标注来源 URL 和置信度

F2模型基础信息库

  • 功能名称:模型基础信息库
  • 一句话描述:存储所有模型的元数据(名称/版本/厂商/模态/上下文/能力/状态)
  • 用户故事:作为用户,我想查询某个模型的发布时间、上下文窗口、支持的 capabilities无需跳转到多个官网
  • 功能优先级P0
  • Phase 归属Phase 1
  • 技术依赖F1 数据采集引擎PostgreSQL Schema model_provider / model
  • 验收标准
    • 字段完整率 > 95%(名称/版本/模态/context_length/capabilities/status
    • 支持按厂商/模态/状态筛选
    • 模型状态变更自动追踪active → deprecated → discontinued

F3区域定价数据库

  • 功能名称:区域定价数据库
  • 一句话描述:存储所有运营商 × 模型 × 区域的完整定价,支持 USD/CNY/EUR 换算与历史追踪
  • 用户故事:作为用户,我想比较"DeepSeek V4-Flash 在阿里云和硅基流动的 CNY 价格差异",一目了然
  • 功能优先级P0
  • Phase 归属Phase 1
  • 技术依赖F1 数据采集引擎PostgreSQL Schema operator / region_pricing / pricing_change
  • 验收标准
    • 支持 CNY/USD 双视图,汇率自动更新
    • 价格变动记录保留历史,支持趋势查看
    • 每条价格标注来源 URL标注数据质量官方/推测/已过期)

F4免费政策库

  • 功能名称:免费政策库
  • 一句话描述:汇总所有平台的免费模型、免费额度、限流规则与区域限制
  • 用户故事:作为小龙,我想查"中文写作性价比最高的免费模型"5秒内找到答案
  • 功能优先级P1
  • Phase 归属Phase 2
  • 技术依赖F1 数据采集引擎多数据源扩充后PostgreSQL Schema free_tier
  • 验收标准
    • 覆盖 20+ 平台的免费政策
    • 包含:免费模型列表、每日/每月请求上限、Token 上限、QPS 限制、区域限制
    • 支持筛选:完全免费 / 限流免费 / 仅新用户

F11趋势分析

  • 功能名称:趋势分析
  • 一句话描述:基于历史价格数据生成趋势图,支持周/月维度对比
  • 用户故事:作为项目经审,我想看"过去3个月 Kimi K2 的价格走势",辅助选型决策
  • 功能优先级P1
  • Phase 归属Phase 2
  • 技术依赖F3 定价数据库时序数据库TimescaleDB图表库ECharts
  • 验收标准
    • 支持 7d / 30d / 90d 趋势视图
    • 支持多模型横向对比
    • 支持价格变动时间线标注

2.2 查询模块Query


F6搜索与筛选

  • 功能名称:搜索与筛选
  • 一句话描述:支持按厂商/模态/场景/价格区间/上下文长度/免费/付费的组合筛选与关键词搜索
  • 用户故事:作为立立,我想查"支持 function calling、上下文超过 100K、输入价格低于 ¥0.5 的免费模型"
  • 功能优先级P0
  • Phase 归属Phase 1
  • 技术依赖PostgreSQL 全文检索;前端筛选组件
  • 验收标准
    • 支持多条件组合筛选(厂商 + 模态 + 价格 + 上下文 + 免费)
    • 支持关键词搜索(模型名/厂商名/特性)
    • 支持卡片视图 / 表格视图切换
    • 搜索结果 < 500ms 响应

F7成本计算器

  • 功能名称:成本计算器
  • 一句话描述:输入 Token 数量(输入/输出分开),输出各平台成本对比排行榜,支持按月用量估算
  • 用户故事:作为财务,我想知道"月均 1000 万输入 + 500 万输出 tokens各平台成本是多少"
  • 功能优先级P1
  • Phase 归属Phase 2
  • 技术依赖F3 定价数据库;前端计算组件
  • 验收标准
    • 支持输入/输出 Token 分开计费
    • 输出按成本升序排列的对比表
    • 支持按月用量估算1M / 10M / 100M / 自定义)
    • 支持货币切换CNY/USD

2.3 分析模块Analyze


F9模型评测聚合

  • 功能名称:模型评测聚合
  • 一句话描述:汇总 MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等权威基准分,按场景排名
  • 用户故事:作为立立,我想知道"编码能力最强的开源模型是哪个",参考评测数据做选型
  • 功能优先级P1
  • Phase 归属Phase 2
  • 技术依赖评测数据源PapersWithCode / LM Arena评测数据库 Schema
  • 验收标准
    • 覆盖 6+ 主流基准MMLU / HumanEval / GSM8K / MATH / LiveCodeBench / SWE-Bench
    • 支持按场景排序(编码/推理/写作/免费)
    • 评测数据标注来源和测试日期

2.4 报告模块Report


F5每日自动报告生成

  • 功能名称:每日自动报告生成
  • 一句话描述:每日 08:00 自动生成 Web 页面报告,包含新模型、价格变动、免费政策变更、场景推荐
  • 用户故事作为用户我希望每天早上花2分钟看完报告知道今天哪个模型最值得用
  • 功能优先级P0
  • Phase 归属Phase 1
  • 技术依赖F1/F2/F3 数据基础Cron 调度Markdown 输出
  • 验收标准
    • 每日 08:00 定时触发,报告生成 < 30 秒
    • 报告内容:新模型上线、价格变动(>5% 高亮)、场景推荐
    • Markdown 文件输出到 reports/daily/ 目录
    • 报告命令可手动重放

F12历史对比

  • 功能名称:历史对比
  • 一句话描述:支持历史报告与当前数据对比,查看模型上线/价格变化/下线的历史时间线
  • 用户故事:作为项目经审,我想看"GPT-5.4 发布前后,同类模型价格变化对比"
  • 功能优先级P2
  • Phase 归属Phase 2
  • 技术依赖F5 每日报告;daily_report 表;历史数据存储
  • 验收标准
    • 支持报告版本对比(任意两天报告差异)
    • 支持模型/价格/免费政策的历史时间线
    • 支持导出对比报告HTML/PDF

2.5 订阅模块Subscribe


F8价格变动告警

  • 功能名称:价格变动告警
  • 一句话描述:当模型价格变动超过阈值(默认 10%),自动推送告警至钉钉/飞书/Email
  • 用户故事:作为用户,我关注 DeepSeek V4-Flash当价格涨跌超过 10% 时希望立即知道
  • 功能优先级P1
  • Phase 归属Phase 2
  • 技术依赖F3 定价数据库;变更检测逻辑;钉钉/飞书/Email 集成
  • 验收标准
    • 可配置阈值(默认 10%,支持 5%/15%/20%
    • 支持白名单(关注特定模型/平台)
    • 告警内容包含:模型名、原价、新价、变动幅度、来源链接
    • 支持钉钉群/飞书群/Email 三种推送方式

F13订阅与推送

  • 功能名称:订阅与推送
  • 一句话描述:用户可订阅关注特定厂商/模型/场景,支持按订阅条件推送定制化报告
  • 用户故事:作为用户,我只关心 DeepSeek 和 Kimi想只收到这两个厂商的价格变动通知
  • 功能优先级P2
  • Phase 归属Phase 2
  • 技术依赖F8 告警系统;订阅管理 Schema用户偏好存储
  • 验收标准
    • 支持按厂商/模型/场景订阅
    • 支持推送频率配置(实时/每日/每周汇总)
    • 支持 Email / 钉钉 / 飞书 三种接收渠道

2.6 进阶功能Should Have / Could Have


F10API 接口

  • 功能名称API 接口
  • 一句话描述:提供 JSON API 供 AI Agent 查询最优模型,支持 MCP Server 集成
  • 用户故事作为宰相AI 助理),我想调用 API 自动为用户选择最优模型,不用每次问人
  • 功能优先级P0
  • Phase 归属Phase 2
  • 技术依赖REST API 框架FastAPI/FlaskMCP Server 实现
  • 验收标准
    • 提供 /models 查询接口(按模态/价格/场景过滤)
    • 提供 /cost 计算接口(输入/输出 Token 计算成本)
    • 提供 /recommend 推荐接口(输入场景,输出最优模型列表)
    • MCP Server 支持 OpenClaw / Claude Code 集成
    • API 响应 < 500ms

三、优先级矩阵

功能 ID 功能名称 P0 P1 P2 Phase 1 Phase 2
F1 多源数据采集引擎
F2 模型基础信息库
F3 区域定价数据库
F6 搜索与筛选
F5 每日自动报告生成
F4 免费政策库
F7 成本计算器
F9 模型评测聚合
F8 价格变动告警
F11 趋势分析
F10 API 接口
F12 历史对比
F13 订阅与推送

P0 × Phase 1 核心功能栅格

Phase 1 MVP 核心功能P0

┌─────────────────────────────────────────────────────┐
│ F1  多源数据采集引擎                               │
│ F2  模型基础信息库                                 │
│ F3  区域定价数据库                                 │
│ F6  搜索与筛选                                     │
│ F5  每日自动报告生成                               │
└─────────────────────────────────────────────────────┘

+ P1 提升Phase 1 纳入):
  F4  免费政策库  → Phase 2多数据源扩充后

四、Phase 1 MVP 定义

目标:上线一个可用的 LLM 情报追踪系统,覆盖 20+ 厂商、500+ 模型,每日自动生成中文报告。

MVP 功能清单≤10 个 P0 功能 + 必要 P1

# 功能 ID 功能名称 优先级 验收条件
1 F1 OpenRouter 采集器 P0 从 OpenRouter 自动同步 371+ 模型数据
2 F2 模型基础信息库 P0 模型元数据完整(名称/版本/模态/context/capabilities支持筛选
3 F3 区域定价数据库 P0 CNY/USD 双视图,保留历史价格,支持趋势查看
4 F6 搜索与筛选 P0 组合筛选(厂商+模态+价格+上下文+免费),< 500ms 响应
5 F5 每日自动报告生成 P0 每日 08:00 触发,生成 HTML 报告(新模型/价格变动/场景推荐)
6 PostgreSQL 数据库 P0 models/model_prices/report_runs 三张表,失败日志
7 中文界面 P0 100% 汉化,前端界面友好
8 Explorer 页面 P0 模型表格、筛选、排序、免费标记
9 Dashboard 占位图 P0 价格趋势占位图,数据来自日报生成命令可重放

MVP 不包含F4 免费政策库Phase 1 P1非 MVP、成本计算器F7、评测聚合F9、告警F8、API 接口F10、趋势分析F11、历史对比F12、订阅F13


五、非功能需求

5.1 数据准确性

指标 要求
数据来源标注 每条数据必须标注来源 URL可溯源
置信度分级 官方确认 / 文档推断 / 待核实,三级标注
更新标记 过期数据标记"已失效",保留历史记录
价格校验 同模型多源价格差异 > 20% 时告警并标注"待核实"
错误处理 采集失败写入日志,保留上次成功数据,不覆盖旧数据

5.2 更新频率

数据类型 更新频率 触发方式
海外模型OpenRouter 每日同步 每日 08:00 cron
国内厂商定价 每日同步 每日 08:00 cron
中转平台定价 每日同步 每日 08:00 cron
免费政策变更 变更触发 采集时检测到变化立即更新
价格变动 > 10% 变更触发 实时检测,触发告警
模型状态变更active/deprecated 变更触发 检测到状态变化立即更新

5.3 可用性要求

指标 要求
系统可用性 99.5%(每月停机 < 3.6 小时)
报告生成 < 30 秒(从触发到 HTML 输出)
API 响应 < 500ms/models 查询接口)
数据采集成功率 > 95%(每日采集成功率)
故障恢复 采集失败连续 3 天触发告警;数据库每日备份
日志留存 30 天

5.4 技术约束

指标 要求
部署方式 Docker支持内网部署
数据库 PostgreSQL+ TimescaleDB时序/ SQLite轻量版
存储估算 500+ 模型 × 50 字段 ≈ 100MB每日增量 ~1MB
备份策略 数据库每日全量备份,保留 30 天

六、功能依赖关系图

数据层(采集)
    F1 多源数据采集引擎
       ↓ 采集数据
    ┌─────────────────────────────────┐
    │                                  │
    ↓                                  ↓
F2 模型基础信息库          F3 区域定价数据库
    (Model 表)               (RegionPricing 表)
    ↓                       ↓
F4 免费政策库              F11 趋势分析
    ↓                       (依赖 F3 历史数据)
    ↓
    ┌──────────┬──────────┬──────────┐
    ↓          ↓          ↓          ↓
F6 搜索筛选  F5 报告生成  F9 评测聚合 F7 成本计算器
    ↓          ↓          ↓          ↓
    └──────────┴──────────┴──────────┘
                    ↓
               F8 价格变动告警
               F10 API 接口
               F12 历史对比
               F13 订阅与推送

七、Phase 2 功能概览

Phase 2 在 Phase 1 数据基础上构建增值能力:

功能 描述 差异化价值
F7 成本计算器 Token 用量成本对比 与竞品(硅基流动/AgentDeals拉开差距的核心功能
F9 模型评测聚合 基准分排行 参考 Artificial Analysis但聚合中文可用数据
F8 价格变动告警 >10% 变动实时推送 OpenRouter/硅基流动均无此功能
F11 趋势分析 历史价格趋势图 AgentDeals 有部分功能,但无中文界面和 CNY 视图
F10 API 接口 JSON API + MCP Server 竞品均无 —— 差异化核心AI Agent 集成入口
F12 历史对比 报告版本对比 独有功能,增强数据价值
F13 订阅与推送 定制化订阅 提升用户粘性,与钉钉/飞书深度集成

文档状态:初稿完成,待评审


最后更新2026-05-04 by 宰相AI 辅助)


三、容错与降级设计

每个功能必须包含降级策略:

  • F1 采集器失败:前端显示上次成功数据 + stale 标记 + 人工检查入口
  • F2 模型库查询失败:返回缓存快照,提示"数据可能不是最新"
  • F3 定价库缺失:显示 "pricing unavailable" 而非空白或 0
  • F5 日报生成失败:保留上日报,标题加 "[数据延迟]"
  • F6 搜索失败:降级为简单列表展示,保留筛选框
  • 全局降级开关:维护模式页面,提示服务状态