From 5cb551de684e5acc8a6aaba02ceefae428d25e9b Mon Sep 17 00:00:00 2001 From: phamnazage-jpg Date: Sun, 24 May 2026 18:20:04 +0800 Subject: [PATCH] docs(gates): sync phase6 recovery truth --- OPENCLAW_EXECUTION.md | 15 ++++----- .../openclaw/OPENCLAW_CAPABILITY_BACKLOG.md | 32 +++++++++++++++++-- 2 files changed, 36 insertions(+), 11 deletions(-) diff --git a/OPENCLAW_EXECUTION.md b/OPENCLAW_EXECUTION.md index 8f6275f..875d29c 100644 --- a/OPENCLAW_EXECUTION.md +++ b/OPENCLAW_EXECUTION.md @@ -69,13 +69,13 @@ [✅] 5. 自动采集 + 日报调度闭环落地 [✅] 6. Phase 5 CI 工作流与 Phase 3/Phase 5 验收门禁补齐 [🟡] 7. OpenClaw review / cron / verifier 质量治理持续优化 -[🟡] 8. Phase 6 稳定性门禁与 backlog 降噪仍在收口 +[✅] 8. Phase 6 稳定性门禁已恢复通过,当前转入后续治理项跟踪 ``` **下一步优先**: -1. 修复 `run_real_pipeline.sh` 在 Cloudflare 公开定价抓取上的 live blocker,恢复 Phase 6 真实复跑门禁 -2. 清理 collector window 中的 `precondition_missing` 失败样本,把最近 7 次采集成功率拉回 `>=95%` -3. 在完成上述两项后重跑 `verify_phase6.sh`,再继续 review / cron / verifier 的真实性与降噪质量 +1. 继续收口 review / cron / verifier 的真实性与降噪质量,避免历史 blocker 已消失但 board 仍滞后 +2. 观察 Cloudflare / Perplexity / Vertex 等外部文档源的稳定性,把瞬时网络抖动与真实结构漂移区分开 +3. 维持正式日报、历史重建与手工真实复跑三条运行语义边界,防止后续优化重新串线 ### 当前运行真相 @@ -84,10 +84,9 @@ - `bash scripts/verify_phase3.sh` 已通过,`run_daily.sh` 的正式调度链已收紧真实采集判定并写入来源级运行审计 - `bash scripts/verify_phase5.sh` 已通过,仓库已补齐 `.github/workflows/ci.yml` - `bash scripts/verify_pre_phase6.sh` 已通过,说明 Phase 1~5 门禁当前仍闭环 -- `bash scripts/verify_phase6.sh` 当前 17/17 通过: - - `live_run_result=PASS`:真实采集并输出今日日报(含 SenseNova vision modality 修复) - - `window_gate_result=PASS`:最近 7 次采集成功率 100%;`precondition_missing_only` 样本已滚动出窗口 - - 注意:`precondition_missing_only` 是调度环境纪律问题(cron 环境缺 OPENROUTER_API_KEY),非系统缺陷,`verify_phase6.sh` 已正确归类为 PASS +- `bash scripts/run_real_pipeline.sh` 已于 `2026-05-24 18:15` 真实复跑成功,Cloudflare / Perplexity / Vertex 等外部官方价格链路本轮均通过 +- `bash scripts/verify_phase6.sh` 已于 `2026-05-24 18:17` 通过:`SUMMARY pass=17 fail=0 warn=0` +- 最近 7 次采集窗口已恢复到 `success_rate=100.00%`,`precondition_missing=0` - `bash scripts/verify_importer_smoke.sh`、`bash scripts/importer_smoke_gate_test.sh`、`bash scripts/pipeline_runtime_alignment_test.sh` 已通过;Baichuan / 01.AI / SenseNova / 讯飞 4 个官方 importer 已接入 runtime + smoke + docs 闭环并完成三远端推送 - 正式日报、历史重建和手工真实复跑已分流到不同运行语义 - `fetchLatestReport` 默认只展示正式日报,不会把历史重建当成最新正式产出 diff --git a/reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md b/reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md index 35327af..593bc6e 100644 --- a/reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md +++ b/reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md @@ -10,7 +10,7 @@ --- -## 当前未修复问题速查表(截至 2026-05-20 21:30) +## 当前未修复问题速查表(截至 2026-05-24 18:18) | # | 问题 | 优先级 | 首次暴露 | 修复状态 | 影响次数 | |---|------|--------|----------|----------|----------| @@ -48,13 +48,39 @@ | 32 | 同日 blocker 切换后 backlog current truth 缺少 freshness 提示 | P1 | 05-17 21:30 | ❌ 未修复 | 2 次 | | 33 | 已证伪 blocker 缺少自动降级/撤销机制 | P1 | 05-18 09:30 | ❌ 未修复 | 2 次 | | 34 | 局部 smoke 已通过后缺少全局 blocker 切换提示 | P1 | 05-18 15:10 | ❌ 未修复 | 1 次 | -| 35 | smoke gate 测试脚本老化未跟上 runtime truth | P1 | 05-19 09:32 | ❌ 未修复 | 5 次 | -| 36 | 稳定性窗口持续回落(85.71% → 71.43%) | P1 | 05-20 21:06 | ⚠️ 已回升(本轮窗口从 71.43% 回到 85.71%,precondition_missing 从 2 降回 1) | 2 次 | +| 35 | smoke gate 测试脚本老化未跟上 runtime truth | P1 | 05-19 09:32 | ✅ 已修复(`importer_smoke_gate_test.sh` 已与 runtime truth 对齐并持续通过) | 5 次 | +| 36 | 稳定性窗口持续回落(85.71% → 71.43%) | P1 | 05-20 21:06 | ✅ 已恢复(`verify_phase6.sh` 本轮 17/17 PASS,窗口回到 100%) | 2 次 | --- ## Review 日志 +### 2026-05-24 18:18(main 收尾复核) + +> **前置说明**:本轮不是 cron review,而是上线前收尾复核。前序工作已完成 importer 分组提交、三远端推送和本地 gate。复核目标是确认“已上传”之后的真实上线门禁是否也收敛。 + +#### 本次新增发现 + +- **Phase 6 已恢复通过**:`bash scripts/verify_phase6.sh` 输出 `SUMMARY pass=17 fail=0 warn=0`,此前 Cloudflare `EOF` live blocker 未复现,真实复跑链路恢复。 +- **稳定性窗口恢复到 100%**:最近 7 次采集样本全部成功,`success_rate=100.00%`,`precondition_missing=0`。 +- **runtime / smoke / docs 三层重新对齐**:`run_real_pipeline.sh`、`verify_importer_smoke.sh`、`importer_smoke_gate_test.sh`、`pipeline_runtime_alignment_test.sh` 全部通过。 +- **versioned truth 已收敛**:当前 `main` 已包含 importer/runtime/docs/execution truth,同步到 `origin` / `tksea` / `gitea`,工作区干净。 + +#### 问题 35 状态更新:smoke gate truth 已对齐 + +- **18:18 状态**:`importer_smoke_gate_test.sh` 当前通过,不再错误断言 live smoke 失败。 +- **结论**:从“脚本老化”更新为“已修复”。 + +#### 问题 36 状态更新:稳定性窗口已恢复 + +- **18:18 状态**:窗口成功率已从此前的 71.43% / 85.71% 恢复到 100%。 +- **结论**:从“已回升”更新为“已恢复”,当前不再构成 release blocker。 + +#### 后续仍需跟踪 + +- 历史 blocker 已消失后,board / backlog / execution truth 的自动老化与撤销机制仍不足(问题 20 / 25 / 33 / 34 继续成立)。 +- 外部文档源仍存在瞬时网络抖动风险,后续应继续区分“网络瞬断”与“真实结构漂移”。 + ### 2026-05-20 21:30(第 37 次 review,night-review cron) > **前置说明**:距上一次 review(05-20 21:06)约 **24 分钟**。本轮属于"有 runtime delta 但无主结论 delta":最新 commit 仍未变化、working tree 仍脏且变更量略有增长(+933/-240 vs +900/-247),`verify_phase6.sh` 的 live blocker 继续是 Perplexity 外部文档签名校验超时。关键 delta:稳定性窗口从 `71.43%` 回升到 `85.71%`,precondition_missing 从 2 降回 1。