Files
llm-intelligence/reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md
2026-05-13 14:42:45 +08:00

117 lines
7.9 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# OpenClaw Capability Backlog
本文件用于持续沉淀 OpenClaw 在 `llm-intelligence` 项目推进和自我优化过程中暴露出的能力缺口。
记录原则:
- 只写真实 review 暴露的问题
- 每个问题都要说明影响
- 每个建议都要可执行、可验证
---
## 当前未修复问题速查表(截至 2026-05-13 09:30
| # | 问题 | 优先级 | 首次暴露 | 修复状态 | 影响次数 |
|---|------|--------|----------|----------|----------|
| 1 | 验证器 `rg` 依赖误报 | P0 | 05-07 22:50 | ✅ **已修复**05-10 14:30 确认 `grep` 替换完成) | 10 次 |
| 2 | 验证器退出码设计 | P0 | 05-07 22:50 | ⚠️ 部分(`rg` 误报消除,但三级状态仍未实现) | 10 次 |
| 3 | session 历史工具/业务错误区分 | P1 | 05-07 22:50 | ❌ 未修复 | 11 次 |
| 4 | cron 无主动状态报告机制 | P1 | 05-07 22:50 | ❌ 未修复 | 11 次 |
| 5 | subagent spawn 未传递 workspace | P1 | 05-07 22:50 | ❌ 未修复 | 11 次 |
| 6 | 验收脚本无法检测构建 | P1 | 05-08 09:05 | ❌ 未修复 | 10 次 |
| 7 | 环境变量/API Key 缺失未自动检测 | P1 | 05-08 09:05 | ⚠️ 部分(已写入 review 标准步骤,但未固化到 prompt | 10 次 |
| 8 | 文件修改后未触发 commit 提示 | P2→P1 | 05-08 09:05 | ❌ 未修复 | 12 次 |
| 9 | cron review 无 delta 时空转 | P1 | 05-08 09:12 | ❌ 未修复 | 12 次 |
| 10 | 验证模式伪进展artifact_present 局限) | P1 | 05-08 14:30 | ❌ 未修复 | 9 次 |
| 11 | **项目提交停滞commit stagnation** | **P0** | **05-08 21:30** | **❌ 未修复(最新仍停留 05-08 commit** | **12 次** |
| 12 | review 报告未触发修复动作 | P2→P1 | 05-08 21:30 | ❌ 未修复 | 9 次 |
| 13 | BACKLOG 文件膨胀导致 review 成本递增 | P1 | 05-09 09:30 | ⚠️ 部分(已实施分层归档,但主文件仍在增长) | 7 次 |
| 14 | **untracked 核心代码未入版本控制** | **P0** | **05-10 21:30** | **❌ 未修复(本轮仍大量 untracked** | **7 次** |
| 15 | **CI 配置存在但未验证运行** | **P1** | **05-10 21:30** | **❌ 未修复(仍仅 artifact-present** | **7 次** |
| 16 | **Phase 6+ 范围未定义** | **P1** | **05-10 21:30** | **❌ 未修复** | **5 次** |
| 17 | collection_stats vs collector_stats 表名不一致 | P2 | 05-11 09:30 | ✅ **已澄清为误报**05-11 14:30 确认 verify_phase2.sh 与 schema 一致) | 1 次 |
| 18 | **无 .gitignore 文件** | **P1** | **05-11 14:30** | **❌ 未修复** | **3 次** |
| 19 | **review 误报传播** | **P1** | **05-11 14:30** | **❌ 未修复** | **4 次** |
| 20 | **untracked 文件统计遗漏** | **P1** | **05-11 14:30** | **❌ 未修复** | **3 次** |
| 21 | **验收脚本瞬时回归缺少稳定性标记** | **P1** | **05-12 22:46** | **❌ 未修复(本轮再次证明单次 FAIL 可能下一轮恢复)** | **3 次** |
| 22 | **无 delta 场景缺少老化风险优先策略** | **P2** | **05-12 22:46** | **❌ 未修复** | **3 次** |
| 23 | **日报归档路径门禁失配** | **P0** | **05-13 00:15** | **⚠️ 待复核(本轮未复现,当前 `verify_phase6.sh` 已 PASS** | **1 次** |
| 24 | **综合验收错误聚合误导根因判断** | **P1** | **05-13 00:15** | **❌ 未修复** | **1 次** |
---
## Review 日志
### 2026-05-13 09:30第 18 次 reviewmorning-review
> **前置说明**:距上一次 review05-13 00:15约 **9 小时 15 分钟**。本轮仓库状态的关键 delta 是:上一轮记录为 FAIL 的 `verify_phase6.sh`,本轮实际执行恢复为 **PASS**。这说明上一轮暴露的归档门禁问题当前未复现;与之相对,版本控制停滞与大量 untracked 仍无 delta继续是最老化、最真实的系统性风险。**
#### 本次新增发现
- **综合验收当前恢复正常**`bash scripts/verify_phase6.sh` 返回 `SUMMARY pass=14 fail=0 warn=0``PHASE_RESULT: PASS`,说明主链路当前可运行。
- **上一轮 FAIL 更像瞬时状态,不足以直接定性为结构性回归**至少在本轮时间窗口内Phase 3/Phase 6 未再失败。
- **review 的长期主风险未变**:最后 commit 仍停在 `ba054f0`2026-05-08大量 modified/untracked 仍存在,导致“功能已做出但无版本锚点”的风险继续累积。
- **CI 证据仍停留在 artifact-present**`.github/` 虽存在,但仍未进入 git 历史,也没有本轮可引用的真实 workflow run 结果。
#### 问题 21P1验收脚本瞬时回归缺少稳定性标记再次确认
- **09:30 状态**:上一轮 review 记录 `verify_phase6.sh` FAIL本轮同命令恢复 PASS。
- **影响**
- 单次 FAIL 容易被 review 写成结构性故障
- backlog 会积累“本轮失败、下轮恢复”的噪声,降低长期可读性
- 团队可能误把短时波动当成实现回归,分散精力
- **优化建议**
1. review prompt 中增加“单次 FAIL 先标记为 transient-suspect连续复现或稳定复现后再升级为结构性问题”
2. Phase 验收脚本失败后,若成本允许,自动补跑一次最小复验命令,区分瞬时波动与稳定故障
3. backlog 条目增加“复现状态”字段,如 `single-hit / repeated / reproducible`
- **建议验证方法**:后续若再次出现单轮 FAIL要求下一轮或同轮最小复验后再决定是否升级 backlog 严重度
#### 问题 23P0→待复核日报归档路径门禁失配
- **09:30 状态**:本轮未复现。`bash scripts/verify_phase6.sh` 已整体 PASS说明上一轮的 Phase 3/归档门禁异常当前不是稳定故障。
- **影响**
- 若未来复现,仍会级联拖累综合验收判断
- 但在本轮证据下,不应继续把它包装成“当前稳定存在的结构性 P0 故障”
- **优化建议**
1. 保留条目,但状态降级为“待复核/瞬时问题”
2. 下次若再触发,必须同时保存失败时的期望路径与实际路径
3. 在 review 里区分“当前活跃故障”和“历史单次异常”
- **建议验证方法**:未来若再次出现 Phase 3 FAIL立即单独执行 `bash scripts/verify_phase3.sh` 并采集路径证据;若连续两轮复现,再升回结构性问题
#### 问题 24P1综合验收错误聚合误导根因判断
- **09:30 状态**:本轮虽未触发 FAIL但问题仍未修复因为顶层脚本的失败聚合可读性并未被专门改进。
- **影响**
- 下一次综合验收失败时review 仍可能被顶层压缩输出误导
- 人工下钻成本高,容易产生二次误报
- **优化建议**
1. `verify_phase6.sh` 在调用 `verify_pre_phase6.sh` 失败时直接输出失败 phase 名称
2. `verify_pre_phase6.sh` 增加失败 phase 列表摘要
3. review prompt 固化“综合门禁 FAIL 必须下钻子 phase”规则
- **建议验证方法**:人为制造单个子 phase 失败,确认顶层输出能直接定位到具体失败 phase 与失败项
---
## 已归档问题(修复后移入)
### 2026-05-10 14:30 — 问题 1 归档:验证器 `rg` 依赖误报
- **首次暴露**2026-05-07 22:50
- **修复时间**2026-05-10 14:30 前
- **修复方式**`TASKS.md` 中 T-1.1 和 T-3.2 的验证命令从 `rg -n` 替换为 `grep -nE`
- **验证方法**`go run scripts/verification_executor.go` 在无 `rg` 环境下返回 PASS
- **残余注意**:验证器本身仍未实现 toolchain readiness check 和三级状态
### 2026-05-11 14:30 — 问题 17 归档collection_stats vs collector_stats 表名不一致
- **首次暴露**2026-05-11 09:30误报
- **澄清时间**2026-05-11 14:30
- **澄清方式**:二次验证 `grep -n "collector_stats" scripts/verify_phase2.sh` 确认脚本与 schema 一致
- **根因**09:30 review 未实际验证即复制了错误结论
- **教训**review 中的 "不一致" 声称必须二次验证,不能仅凭记忆或旧报告复制
---
*Backlog 最后更新2026-05-13 09:30 Asia/Shanghai*