Files
llm-intelligence/PRD.md

6.1 KiB
Raw Blame History

LLM Intelligence Hub — 产品需求文档 v0.1

文档版本v0.1 日期2026-05-03 负责人宰相AI 辅助) 状态:初稿,征询中


一、产品概述

1.1 背景与问题

背景

  • 大模型LLM市场竞争激烈OpenAI/Anthropic/Google/DeepSeek/Meta 等提供商持续发布新版本、调整定价和免费政策
  • 「立交桥」项目需要在多个 AI Agent 间做模型决策,需要实时掌握各模型的能力、定价、免费额度、区域限制等信息
  • 现有信息分散在多个平台OpenRouter、Anthropic 官网、Google AI Studio、GitHub 等),缺乏统一聚合视图

核心问题

  1. 模型信息分散,更新不及时
  2. 免费政策区域差异大,难以获取完整信息
  3. 定价随版本快速变化,人工维护成本高
  4. 缺乏一个可持续积累的 LLM 知识库

1.2 目标

建设一个可持续运营的 LLM 情报中心

  • 自动采集 + 人工补充,持续追踪 20+ 提供商的模型动态
  • 建立结构化 LLM 数据库(定价/能力/政策/评测)
  • 每日自动生成可视化报告Web 页面)
  • 支持按场景(编码/写作/推理/免费)筛选最优模型

1.3 成功指标

指标 目标值
模型覆盖率 20+ 提供商500+ 模型
信息更新频率 每日增量更新
报告生成 每日 08:00 自动生成
Web 可访问性 内网可访问,支持导出 PDF

二、功能需求

2.1 核心功能Must Have

F1模型数据库

  • 字段模型名称、提供商、版本、API ID、输入价格、输出价格、上下文窗口、CapabilitiesVision/Tools/JSON等、免费标记、免费额度、区域限制、更新时间
  • 来源OpenRouter API724模型、Anthropic/Google 官方文档、GitHub 模型列表
  • 更新策略:每日增量同步 + 人工校正

F2免费政策追踪

  • 内容:各提供商免费模型列表、免费额度说明、限流规则、区域限制
  • 特殊标记:限时免费、试用政策、新用户优惠

F3区域定价追踪

  • 内容:同一模型在不同区域的定价差异(如中国区 vs 全球区)
  • 货币支持USD/CNY/EUR 汇率换算

F4每日报告生成

  • 格式Web 页面HTML+ PDF 导出
  • 内容
    • 今日新上线/更新模型
    • 价格变动提醒
    • 免费政策变更
    • 热门模型 TOP 10 推荐(按场景)
    • 成本优化建议

F5搜索与筛选

  • 筛选维度:提供商、免费/付费、场景(编码/写作/推理)、价格区间、上下文长度
  • 搜索:模型名称、提供商、特性关键词

2.2 进阶功能Should Have

F6价格对比计算器

  • 输入 Token 数量 → 输出各提供商成本对比
  • 按月成本估算

F7模型评测排行榜

  • 聚合 MMLU / HumanEval / GSM8K / MATH 等基准评测数据
  • 按场景排名(编码/推理/写作/免费)

F8告警系统

  • 价格变动 > 10% 触发告警
  • 新模型上线通知
  • 免费额度变更通知

F9API 接口

  • 提供 JSON API 供其他系统集成
  • 支持 AI Agent 查询最优模型

2.3 未来功能Nice to Have

F10竞品追踪

  • 追踪各提供商市场份额、融资动态、战略动向

F11多语言界面

  • 中文 / 英文双语界面

三、非功能需求

3.1 技术要求

  • 部署:内网服务器,支持 Docker 部署
  • 存储SQLite轻量+ PostgreSQL生产
  • 数据量:预估 500+ 模型 × 50+ 字段,每日增量 10-50 条
  • 性能:报告生成 < 30 秒

3.2 运维要求

  • 自动更新:每日 08:00 cron 触发数据同步
  • 监控:失败告警、日志留存 30 天
  • 备份:数据库每日增量备份

3.3 安全要求

  • 访问控制:内网认证(如需)
  • 数据来源标注:所有数据标注来源 URL确保可溯源

四、竞品参考

竞品 URL 核心能力 弱点
OpenRouter openrouter.ai/models 724模型实时数据免费标记ELO排名 无中文界面,不追踪区域定价
AIPriceIndex (GitHub) LLM 定价历史追踪 仅定价,无评测
Artificial Analysis artificialanalysis.ai 模型性能排行,成本计算 付费为主,无免费模型追踪
truefoundry/models (GitHub) 21提供商 1000+模型配置 非实时,需人工 PR 更新
Model-ID-Cheatsheet (GitHub) 107模型精确 ID 仅 API ID无定价

五、技术方案建议

方案 A快速启动

  • 数据源OpenRouter API + 官方文档爬虫
  • 存储SQLite + 每日 CSV 导出
  • 报告:静态 HTML 页面 + GitHub Pages 托管
  • 工期2 周 MVP

方案 B生产级

  • 数据源OpenRouter + Anthropic + Google + DeepSeek 官方 API
  • 存储PostgreSQL + TimescaleDB时序数据
  • 报告Web DashboardReact + PDF 自动生成
  • 告警:邮件/钉钉通知
  • 工期4-6 周

六、用户故事

# 用户 故事
U1 立立 "我每天早上看一眼报告,就知道今天该用哪个模型省钱"
U2 小龙 "我想查某个场景下最便宜的免费模型5秒内找到"
U3 宰相 "我想让 AI Agent 能自动查询最优模型,不用每次问人"
U4 项目经审 "我想看到本周价格变动汇总,作为成本核算依据"

七、风险与依赖

风险 影响 应对
数据源 API 变更 爬虫失效 多源交叉验证,建立镜像
免费额度频繁调整 报告滞后 每日检查 + 变更告警
提供商定价策略差异化 数据结构复杂 设计灵活 schema支持扩展字段

八、上线计划

阶段 内容 目标
Phase 0 需求确认 + 技术方案选定 1 周
Phase 1 MVP10 提供商数据 + 静态报告 2 周
Phase 2 Web Dashboard + 告警 + 评测排行 2 周
Phase 3 API 开放 + Agent 集成 1 周