Files
llm-intelligence/docs/NEXT_IMPORTER_RUNTIME_PRIORITY.md

122 lines
5.2 KiB
Markdown
Raw Normal View History

# 下一批 importer / runtime 挂载优先清单
> For Hermes: 这是基于当前 `PLAN_CATALOG_COVERAGE_MATRIX.md` 的执行清单,不是泛泛 roadmap。优先修“高价值且证据已足够”的缺口再做长尾扩展。
更新时间2026-05-22
## 本轮已完成的小批次闭环
已完成并验证:
1. 腾讯云 TokenHub runtime 挂载
2. 魔搭 API-Inference importerKey 校准
3. 天翼云模型推理服务 payg importerKey 校准
4. 联通云 Token Plan pricing importer3 模型 blended price + 区域支持矩阵)
对应结果:
- `tencent_subscription` 已进入 `run_daily.sh` / `run_intel_pipeline.sh` / `run_real_pipeline.sh`
- `verify_importer_smoke.sh` 已新增腾讯 fixture/live smoke并通过
- `魔搭 API-Inference``天翼云模型推理服务 payg` 已从错误的价格 importer 映射回退到 `import_catalog_seed_verification.go`
- `cucloud_pricing` 已进入 `run_daily.sh` / `run_real_pipeline.sh` / `run_intel_pipeline.sh`
- `verify_importer_smoke.sh` 已新增联通云 fixture/live smoke并通过
- 覆盖矩阵已同步到新真相
## 当前事实基线
来自 `docs/PLAN_CATALOG_COVERAGE_MATRIX.md`
- 目录基线71/71
- 目录核验32/71
- 已有 importer35/71
- 已真实入库35/71
- 仍缺细颗粒度价格41/71
解读:
- 这轮不是单纯“把数字做大”
- 而是先消除了 source 归属漂移,让 `已真实入库` 统计更可信
---
## 现在的下一批优先级
### P1补国内高价值官方平台的真实 payg importer
| 优先级 | 平台 | 当前状态 | 价值 | 建议动作 |
|---|---|---|---|---|
| P1-1 | 百川 / 零一万物 / 商汤 / 讯飞 | 只有目录核验 | 都在国内 Top20 前半区,适合模板化批量推进 | 按统一 official pricing importer 模板推进 |
### P2补中转/聚合平台的细颗粒度价格
| 优先级 | 平台 | 当前状态 | 价值 | 建议动作 |
|---|---|---|---|---|
| P2-1 | 移动云 MoMA | 已升级为官方价格 importer并补齐语音按字符/按秒计费落表 | 文本/视觉/向量/排序/语音模型都可进入价格对比 | 已完成,后续仅做新增模型跟进 |
| P2-2 | 联通云 AICP / AI 应用开发平台 | 已新增 `cucloud_pricing`,但当前只覆盖 AISP Token Plan 3 模型 blended price 与区域矩阵 | 目录入口与部分结构化价格已打通,但 payg per-model 公开价表仍缺 | 后续若官方公开 payg 模型销售价,再扩 `import_cucloud_pricing.go` |
| P2-3 | 豆包与 Seed 开放平台 | 已有多源/订阅链路,但仍缺细颗粒度价格标注 | 当前矩阵里仍保留缺口 | 区分“已有多源模型采集”与“官方价格页结构化价格”能力 |
| P2-4 | 天翼云息壤 / CloudBase AI+ / TI 平台大模型广场 | manual_review | 平台入口存在,但尚无真实 importer | 先回查官方页面结构,再决定 catalog importer 还是 pricing importer |
### P3全球参考集从目录核验升级为真实价格 importer
首批建议顺序:
1. Gemini API
2. Mistral La Plateforme
3. Cohere Platform
4. Together AI
5. Fireworks AI
6. DeepInfra
7. GroqCloud
原因:
- 都已确认有官方价格页
- 都适合复用统一 official pricing importer 模板
- 对“全球平台横向价格比较”价值高
---
## 推荐执行顺序
### 第一批(已完成的小批次闭环)
1. 通义千问开放平台 payg importer
2. 腾讯混元开放平台 payg importer
3. 华为云 MaaS payg importer对应原规划里的“盘古大模型服务”位点当前公开 payg 实际覆盖 MaaS 文本模型集合)
理由:
- runtime/source 真相已经同步到 run_daily / run_real_pipeline / run_intel_pipeline
- seed/importerKey 已从目录核验切换到真实官方 pricing importer
- 华为侧保留 package + payg 双链路;但公开 payg 页面未见独立盘古 SKU 单价,已按真实页面语义落地
### 第二批(平台深挖)
4. 移动云 pricing importer 后续 schema 扩展
5. 联通云 payg per-model 价格公开表跟进
6. 百川 / 零一万物 / 商汤 / 讯飞 任一官方 payg importer
注:火山方舟官方价格页结构化 importer 已接入 `import_bytedance_pricing.go`,当前覆盖 `在线推理(常规)` 公开的 token 定价;向量/图片/3D 与低延迟/批量/TPM 保障包仍待 schema 扩展后细化。
### 第三批(全球参考集)
7. Gemini API
8. Mistral La Plateforme
9. Cohere Platform
---
## 下一步验收口径
每完成一项,都必须同步验证这 4 件事:
1. seed / importerKey 是否与真实脚本一致
2. `run_daily.sh` / `run_intel_pipeline.sh` / `run_real_pipeline.sh` 是否真正执行了该 source
3. 覆盖矩阵状态是否已同步
4. 若新增 sourcepipeline audit / failed_source_keys 是否能正确反映它
## 建议结论
如果下一步只选一条最值得马上做的线:
A. 先做 `百川 / 零一万物 / 商汤 / 讯飞` 中任一条官方 payg importer
如果允许做一个“小批次闭环”:
B. `移动云语音价补齐 + 联通云 payg 公开价跟进 + 百川/零一万物/商汤/讯飞 任一官方价格页 importer`
通义千问 / 腾讯混元 / 华为云 MaaS / 联通云 Token Plan 这一批已完成,后续优先转向仍缺公开 payg 价格的平台。