niuniu/llm-intelligence

Fork 1

Files

phamnazage-jpg 77e6610fd2

CI / test (push) Has been cancelled

Details

chore: prepare repository for publishing

2026-05-13 14:42:45 +08:00

17 KiB

Raw Permalink Blame History

LLM Intelligence Hub — 功能清单（Feature List）

文档版本：v1.1 日期：2026-05-09 状态：Phase 1 已冻结，与 PRD v0.3 / TECH v1.1 对齐

一、功能总览

按用户场景分为五大模块：

模块	核心能力	对应功能
追踪（Track）	实时掌握模型动态	F1 数据采集、F2 模型基础库、F3 定价库、F4 免费政策库
查询（Query）	快速找到目标信息	F6 搜索与筛选、F7 成本计算器
分析（Analyze）	深度理解数据	F9 模型评测聚合、F11 趋势分析
报告（Report）	自动化输出	F5 每日自动报告生成、F12 历史对比
订阅（Subscribe）	实时通知	F8 价格变动告警、F13 订阅与推送

二、功能详细描述

2.1 追踪模块（Track）

F1：多源数据采集引擎

功能名称：多源数据采集引擎
一句话描述：自动从 OpenRouter 同步模型与定价数据（Phase 1 单数据源）
用户故事：作为系统，我希望每日自动从 OpenRouter 采集最新模型信息，无需人工维护
功能优先级：P0
Phase 归属：Phase 1
技术依赖：OpenRouter API（371+ 海外模型）
验收标准：
- OpenRouter 371+ 模型入库
- 每日可重复采集
- 采集失败写入日志，保留上次成功数据
- 每条数据标注来源 URL 和置信度

F2：模型基础信息库

功能名称：模型基础信息库
一句话描述：存储所有模型的元数据（名称/版本/厂商/模态/上下文/能力/状态）
用户故事：作为用户，我想查询某个模型的发布时间、上下文窗口、支持的 capabilities，无需跳转到多个官网
功能优先级：P0
Phase 归属：Phase 1
技术依赖：F1 数据采集引擎；PostgreSQL Schema model_provider / model
验收标准：
- 字段完整率 > 95%（名称/版本/模态/context_length/capabilities/status）
- 支持按厂商/模态/状态筛选
- 模型状态变更自动追踪（active → deprecated → discontinued）

F3：区域定价数据库

功能名称：区域定价数据库
一句话描述：存储所有运营商 × 模型 × 区域的完整定价，支持 USD/CNY/EUR 换算与历史追踪
用户故事：作为用户，我想比较"DeepSeek V4-Flash 在阿里云和硅基流动的 CNY 价格差异"，一目了然
功能优先级：P0
Phase 归属：Phase 1
技术依赖：F1 数据采集引擎；PostgreSQL Schema operator / region_pricing / pricing_change
验收标准：
- 支持 CNY/USD 双视图，汇率自动更新
- 价格变动记录保留历史，支持趋势查看
- 每条价格标注来源 URL，标注数据质量（官方/推测/已过期）

F4：免费政策库

功能名称：免费政策库
一句话描述：汇总所有平台的免费模型、免费额度、限流规则与区域限制
用户故事：作为小龙，我想查"中文写作性价比最高的免费模型"，5秒内找到答案
功能优先级：P1
Phase 归属：Phase 2
技术依赖：F1 数据采集引擎（多数据源扩充后）；PostgreSQL Schema free_tier
验收标准：
- 覆盖 20+ 平台的免费政策
- 包含：免费模型列表、每日/每月请求上限、Token 上限、QPS 限制、区域限制
- 支持筛选：完全免费 / 限流免费 / 仅新用户

F11：趋势分析

功能名称：趋势分析
一句话描述：基于历史价格数据生成趋势图，支持周/月维度对比
用户故事：作为项目经审，我想看"过去3个月 Kimi K2 的价格走势"，辅助选型决策
功能优先级：P1
Phase 归属：Phase 2
技术依赖：F3 定价数据库；时序数据库（TimescaleDB）；图表库（ECharts）
验收标准：
- 支持 7d / 30d / 90d 趋势视图
- 支持多模型横向对比
- 支持价格变动时间线标注

2.2 查询模块（Query）

F6：搜索与筛选

功能名称：搜索与筛选
一句话描述：支持按厂商/模态/场景/价格区间/上下文长度/免费/付费的组合筛选与关键词搜索
用户故事：作为立立，我想查"支持 function calling、上下文超过 100K、输入价格低于 ¥0.5 的免费模型"
功能优先级：P0
Phase 归属：Phase 1
技术依赖：PostgreSQL 全文检索；前端筛选组件
验收标准：
- 支持多条件组合筛选（厂商 + 模态 + 价格 + 上下文 + 免费）
- 支持关键词搜索（模型名/厂商名/特性）
- 支持卡片视图 / 表格视图切换
- 搜索结果 < 500ms 响应

F7：成本计算器

功能名称：成本计算器
一句话描述：输入 Token 数量（输入/输出分开），输出各平台成本对比排行榜，支持按月用量估算
用户故事：作为财务，我想知道"月均 1000 万输入 + 500 万输出 tokens，各平台成本是多少"
功能优先级：P1
Phase 归属：Phase 2
技术依赖：F3 定价数据库；前端计算组件
验收标准：
- 支持输入/输出 Token 分开计费
- 输出按成本升序排列的对比表
- 支持按月用量估算（1M / 10M / 100M / 自定义）
- 支持货币切换（CNY/USD）

2.3 分析模块（Analyze）

F9：模型评测聚合

功能名称：模型评测聚合
一句话描述：汇总 MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等权威基准分，按场景排名
用户故事：作为立立，我想知道"编码能力最强的开源模型是哪个"，参考评测数据做选型
功能优先级：P1
Phase 归属：Phase 2
技术依赖：评测数据源（PapersWithCode / LM Arena）；评测数据库 Schema
验收标准：
- 覆盖 6+ 主流基准（MMLU / HumanEval / GSM8K / MATH / LiveCodeBench / SWE-Bench）
- 支持按场景排序（编码/推理/写作/免费）
- 评测数据标注来源和测试日期

2.4 报告模块（Report）

F5：每日自动报告生成

功能名称：每日自动报告生成
一句话描述：每日 08:00 自动生成 Web 页面报告，包含新模型、价格变动、免费政策变更、场景推荐
用户故事：作为用户，我希望每天早上花2分钟看完报告，知道今天哪个模型最值得用
功能优先级：P0
Phase 归属：Phase 1
技术依赖：F1/F2/F3 数据基础；Cron 调度；Markdown 输出
验收标准：
- 每日 08:00 定时触发，报告生成 < 30 秒
- 报告内容：新模型上线、价格变动（>5% 高亮）、场景推荐
- Markdown 文件输出到 reports/daily/ 目录
- 报告命令可手动重放

F12：历史对比

功能名称：历史对比
一句话描述：支持历史报告与当前数据对比，查看模型上线/价格变化/下线的历史时间线
用户故事：作为项目经审，我想看"GPT-5.4 发布前后，同类模型价格变化对比"
功能优先级：P2
Phase 归属：Phase 2
技术依赖：F5 每日报告；daily_report 表；历史数据存储
验收标准：
- 支持报告版本对比（任意两天报告差异）
- 支持模型/价格/免费政策的历史时间线
- 支持导出对比报告（HTML/PDF）

2.5 订阅模块（Subscribe）

F8：价格变动告警

功能名称：价格变动告警
一句话描述：当模型价格变动超过阈值（默认 10%），自动推送告警至钉钉/飞书/Email
用户故事：作为用户，我关注 DeepSeek V4-Flash，当价格涨跌超过 10% 时希望立即知道
功能优先级：P1
Phase 归属：Phase 2
技术依赖：F3 定价数据库；变更检测逻辑；钉钉/飞书/Email 集成
验收标准：
- 可配置阈值（默认 10%，支持 5%/15%/20%）
- 支持白名单（关注特定模型/平台）
- 告警内容包含：模型名、原价、新价、变动幅度、来源链接
- 支持钉钉群/飞书群/Email 三种推送方式

F13：订阅与推送

功能名称：订阅与推送
一句话描述：用户可订阅关注特定厂商/模型/场景，支持按订阅条件推送定制化报告
用户故事：作为用户，我只关心 DeepSeek 和 Kimi，想只收到这两个厂商的价格变动通知
功能优先级：P2
Phase 归属：Phase 2
技术依赖：F8 告警系统；订阅管理 Schema；用户偏好存储
验收标准：
- 支持按厂商/模型/场景订阅
- 支持推送频率配置（实时/每日/每周汇总）
- 支持 Email / 钉钉 / 飞书三种接收渠道

2.6 进阶功能（Should Have / Could Have）

F10：API 接口

功能名称：API 接口
一句话描述：提供 JSON API 供 AI Agent 查询最优模型，支持 MCP Server 集成
用户故事：作为宰相（AI 助理），我想调用 API 自动为用户选择最优模型，不用每次问人
功能优先级：P0
Phase 归属：Phase 2
技术依赖：REST API 框架（FastAPI/Flask）；MCP Server 实现
验收标准：
- 提供 /models 查询接口（按模态/价格/场景过滤）
- 提供 /cost 计算接口（输入/输出 Token 计算成本）
- 提供 /recommend 推荐接口（输入场景，输出最优模型列表）
- MCP Server 支持 OpenClaw / Claude Code 集成
- API 响应 < 500ms

三、优先级矩阵

功能 ID	功能名称	P0	P1	P2	Phase 1	Phase 2
F1	多源数据采集引擎	✅			✅
F2	模型基础信息库	✅			✅
F3	区域定价数据库	✅			✅
F6	搜索与筛选	✅			✅
F5	每日自动报告生成	✅			✅
F4	免费政策库		✅			✅
F7	成本计算器		✅			✅
F9	模型评测聚合		✅			✅
F8	价格变动告警		✅			✅
F11	趋势分析		✅			✅
F10	API 接口		✅			✅
F12	历史对比			✅		✅
F13	订阅与推送			✅		✅

P0 × Phase 1 核心功能栅格

Phase 1 MVP 核心功能（P0）：

┌─────────────────────────────────────────────────────┐
│ F1  多源数据采集引擎                               │
│ F2  模型基础信息库                                 │
│ F3  区域定价数据库                                 │
│ F6  搜索与筛选                                     │
│ F5  每日自动报告生成                               │
└─────────────────────────────────────────────────────┘

+ P1 提升（Phase 1 纳入）：
  F4  免费政策库  → Phase 2（多数据源扩充后）

四、Phase 1 MVP 定义

目标：上线一个可用的 LLM 情报追踪系统，覆盖 20+ 厂商、500+ 模型，每日自动生成中文报告。

MVP 功能清单（≤10 个 P0 功能 + 必要 P1）

#	功能 ID	功能名称	优先级	验收条件
1	F1	OpenRouter 采集器	P0	从 OpenRouter 自动同步 371+ 模型数据
2	F2	模型基础信息库	P0	模型元数据完整（名称/版本/模态/context/capabilities），支持筛选
3	F3	区域定价数据库	P0	CNY/USD 双视图，保留历史价格，支持趋势查看
4	F6	搜索与筛选	P0	组合筛选（厂商+模态+价格+上下文+免费），< 500ms 响应
5	F5	每日自动报告生成	P0	每日 08:00 触发，生成 HTML 报告（新模型/价格变动/场景推荐）
6	—	PostgreSQL 数据库	P0	models/model_prices/report_runs 三张表，失败日志
7	—	中文界面	P0	100% 汉化，前端界面友好
8	—	Explorer 页面	P0	模型表格、筛选、排序、免费标记
9	—	Dashboard 占位图	P0	价格趋势占位图，数据来自日报生成命令可重放

MVP 不包含：F4 免费政策库（Phase 1 P1，非 MVP）、成本计算器（F7）、评测聚合（F9）、告警（F8）、API 接口（F10）、趋势分析（F11）、历史对比（F12）、订阅（F13）。

五、非功能需求

5.1 数据准确性

指标	要求
数据来源标注	每条数据必须标注来源 URL，可溯源
置信度分级	官方确认 / 文档推断 / 待核实，三级标注
更新标记	过期数据标记"已失效"，保留历史记录
价格校验	同模型多源价格差异 > 20% 时告警并标注"待核实"
错误处理	采集失败写入日志，保留上次成功数据，不覆盖旧数据

5.2 更新频率

数据类型	更新频率	触发方式
海外模型（OpenRouter）	每日同步	每日 08:00 cron
国内厂商定价	每日同步	每日 08:00 cron
中转平台定价	每日同步	每日 08:00 cron
免费政策变更	变更触发	采集时检测到变化立即更新
价格变动 > 10%	变更触发	实时检测，触发告警
模型状态变更（active/deprecated）	变更触发	检测到状态变化立即更新

5.3 可用性要求

指标	要求
系统可用性	99.5%（每月停机 < 3.6 小时）
报告生成	< 30 秒（从触发到 HTML 输出）
API 响应	< 500ms（/models 查询接口）
数据采集成功率	> 95%（每日采集成功率）
故障恢复	采集失败连续 3 天触发告警；数据库每日备份
日志留存	30 天

5.4 技术约束

指标	要求
部署方式	Docker，支持内网部署
数据库	PostgreSQL（主）+ TimescaleDB（时序）/ SQLite（轻量版）
存储估算	500+ 模型 × 50 字段 ≈ 100MB，每日增量 ~1MB
备份策略	数据库每日全量备份，保留 30 天

六、功能依赖关系图

数据层（采集）
    F1 多源数据采集引擎
       ↓ 采集数据
    ┌─────────────────────────────────┐
    │                                  │
    ↓                                  ↓
F2 模型基础信息库          F3 区域定价数据库
    (Model 表)               (RegionPricing 表)
    ↓                       ↓
F4 免费政策库              F11 趋势分析
    ↓                       （依赖 F3 历史数据）
    ↓
    ┌──────────┬──────────┬──────────┐
    ↓          ↓          ↓          ↓
F6 搜索筛选  F5 报告生成  F9 评测聚合 F7 成本计算器
    ↓          ↓          ↓          ↓
    └──────────┴──────────┴──────────┘
                    ↓
               F8 价格变动告警
               F10 API 接口
               F12 历史对比
               F13 订阅与推送

七、Phase 2 功能概览

Phase 2 在 Phase 1 数据基础上构建增值能力：

功能	描述	差异化价值
F7 成本计算器	Token 用量成本对比	与竞品（硅基流动/AgentDeals）拉开差距的核心功能
F9 模型评测聚合	基准分排行	参考 Artificial Analysis，但聚合中文可用数据
F8 价格变动告警	>10% 变动实时推送	OpenRouter/硅基流动均无此功能
F11 趋势分析	历史价格趋势图	AgentDeals 有部分功能，但无中文界面和 CNY 视图
F10 API 接口	JSON API + MCP Server	竞品均无 —— 差异化核心，AI Agent 集成入口
F12 历史对比	报告版本对比	独有功能，增强数据价值
F13 订阅与推送	定制化订阅	提升用户粘性，与钉钉/飞书深度集成

文档状态：初稿完成，待评审

最后更新：2026-05-04 by 宰相（AI 辅助）

三、容错与降级设计

每个功能必须包含降级策略：

F1 采集器失败：前端显示上次成功数据 + stale 标记 + 人工检查入口
F2 模型库查询失败：返回缓存快照，提示"数据可能不是最新"
F3 定价库缺失：显示 "pricing unavailable" 而非空白或 0
F5 日报生成失败：保留上日报，标题加 "[数据延迟]"
F6 搜索失败：降级为简单列表展示，保留筛选框
全局降级开关：维护模式页面，提示服务状态

17 KiB Raw Permalink Blame History Unescape Escape