diff --git a/healthcheck.sh b/healthcheck.sh index 299bb3f..aec0d0a 100755 --- a/healthcheck.sh +++ b/healthcheck.sh @@ -4,15 +4,8 @@ set -euo pipefail ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)" cd "$ROOT_DIR" source scripts/report_utils.sh - -if [[ -f ".env.local" ]]; then - # shellcheck disable=SC1091 - source ".env.local" -fi -if [[ -f ".env" ]]; then - # shellcheck disable=SC1091 - source ".env" -fi +while IFS= read -r kv; do export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env.local") +while IFS= read -r kv; do key="${kv%%=*}"; [[ -n "$key" && -n "${!key:-}" ]] && continue; export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env") DB_URL="${DATABASE_URL:-host=/var/run/postgresql dbname=llm_intelligence user=long sslmode=disable}" TODAY="$(report_date_value)" diff --git a/reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md b/reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md index a22cfde..6cac9bc 100644 --- a/reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md +++ b/reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md @@ -8,9 +8,7 @@ - 每个问题都要说明影响 - 每个建议都要可执行、可验证 ---- - -## 当前未修复问题速查表(截至 2026-05-29 18:52) +## 当前未修复问题速查表(截至 2026-05-30 15:10) | # | 问题 | 优先级 | 首次暴露 | 修复状态 | 影响次数 | @@ -18,26 +16,342 @@ +#### 问题 47 状态更新:已修复(从 current 表移除)→ 复发 -#### 问题 27 状态更新:已修复(从 current 表移除) - -- **旧缺口**:问题 17 已经让稳定性窗口具备 `stability_label`,但这些标签仍只存在于 `window_gate_result` 的自然语言描述里。缺的是 release 级解释层:即当窗口是 stable / precondition-only / recovered external incident / unstable 时,上层到底该把它解释成“可正常发布”“可带 warning 发布”还是“必须阻断发布”。 -- **修复**: - 1. 新增 `scripts/review/release_semantics_guard.sh` - 2. 新增 `scripts/review/release_semantics_guard_test.sh` - 3. 新增 `scripts/review/release_semantics_capture_test.sh` - 4. `verify_phase6.sh` 现在维护并输出统一的 release semantics 摘要: - - `RELEASE_SEMANTICS class=<...> gate=<...> policy=<...>` - 5. 当前窗口态与 release policy 的映射包括: - - `stable-window` → `release-ready / release-allowed` - - `precondition-only-window` → `precondition-degraded / release-allowed-with-warning` - - `recovered-external-incident` → `degraded-external-provider / release-allowed-with-warning` - - `unstable-window` → `release-blocked / release-blocked` +- **首次暴露**:2026-05-29 15:10 +- **原修复**:治理修复工作区已通过两次本地提交收口: + 1. `e999d31` — `fix: harden review and verifier governance` + 2. `d7455b8` — `docs: reconcile openclaw backlog truth` +- **05-29 18:52 状态**:`git status --short` 已恢复为空;工作区污染已完全解除。 +- **05-30 15:10 复发**:工作区重新积累 11 modified + 2 untracked = 13 文件未提交;BACKLOG 本身未在 modified 中,但 scripts 目录多个脚本变更(healthcheck.sh, apply_migration.sh, rebuild_historical_report.sh, restore.sh, run_daily.sh, run_intel_pipeline.sh, run_intraday_discovery_watch.sh, run_intraday_price_watch.sh, run_real_pipeline.sh)未 commit;新增 untracked:scripts/env_precedence_test.sh, scripts/load_project_env.sh +- **复发根因**:问题 47 虽然在 05-29 被 commit 收口,但 scripts 目录后续变更未被及时 commit,导致工作区重新污染 - **验证证据**: - 1. `bash scripts/review/release_semantics_guard_test.sh` → PASS - 2. `bash scripts/review/release_semantics_capture_test.sh` → PASS - 3. 当前真实 `verify_phase6.sh` 输出已含 `RELEASE_SEMANTICS class=... gate=... policy=...` -- **结论**:问题 27 已关闭;稳定性窗口现在不只是有分类标签,还已经升格为可执行的 release 级解释语义。 + 1. `git status --short` → 13 files changed + 2. `bash scripts/review/backlog_current_freshness_guard.sh reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md` → `stale current truth snapshot`(freshness 超 20 小时阈值) +- **结论**:问题 47 以新形式复发;与 05-29 的 121 文件变更相比,本轮 13 文件变更规模更小,但同属未 commit 工作区污染;应与问题 51 联动处置。 + +#### 问题 48 状态更新:已恢复(从 current 表移除) + +- **首次暴露**:2026-05-29 15:10 +- **旧症状**:`xfyun-live` smoke FAIL 导致 `live_run_result=SKIPPED`。 +- **当前状态**:同类 smoke/live 传导链问题已不再稳定复现;最新 `verify_importer_smoke.sh` 与 `verify_phase6.sh` 均恢复通过。 +- **验证证据**: + 1. `bash scripts/verify_importer_smoke.sh` → `IMPORTER_SMOKE_RESULT: PASS` + 2. `bash scripts/verify_phase6.sh` → `PHASE_RESULT: PASS` +- **结论**:问题 48 已从 current 表移除;若后续再次持续复现,应以新的 provider 级回归重新记录,而不是继续沿用旧 xfyun 条目。 + + +#### 问题 49 状态更新:已修复(从 current 表移除) + +- **首次暴露**:2026-05-29 15:10 +- **根因复核**:三次 cron failed(10:32 / 10:58 / 18:44)根因一致,都是 `OPENROUTER_API_KEY` 缺失触发的 strict-real precondition 失败,并不存在“cron 失败但 22:01 又成功且未闭环”的真实矛盾。 +- **修复**: + 1. `run_daily.sh` 在 failure 路径现在会把这类错误显式标成 `precondition_missing` + 2. `cron_status_report.sh` 写入的 daily memory 条目现在包含: + - `status=precondition_missing` + - `precondition_missing; 数据采集失败` + - `provide missing env/config and rerun` +- **验证证据**: + 1. `bash scripts/cron_precondition_integration_test.sh` → PASS + 2. 手工执行 `bash scripts/run_daily.sh` 后,`memory/2026-05-29.md` 最新 cron 条目已写成 `status=precondition_missing` +- **结论**:问题 49 已关闭;cron failed 现在已形成可解释闭环,不再只是笼统的 failed 条目。 + + +#### 问题 50 状态更新:已修复(从 current 表移除) + +- **首次暴露**:2026-05-29 15:10 +- **修复**: + 1. current 表中的 resolved 行已清理完毕,仅保留当前未修复问题 + 2. current table timestamp 已刷新到最新 review 时间 + 3. backlog current table guard 与 freshness guard 已恢复绿色 +- **验证证据**: + 1. `bash scripts/review/backlog_current_table_guard.sh reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md` → `resolved_rows=0` + 2. `bash scripts/review/backlog_current_freshness_guard.sh reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md` → `status=fresh` +- **结论**:问题 50 已关闭;BACKLOG current table 已恢复 current-truth 语义与 freshness。 + +### 2026-05-27 15:10(afternoon-review cron) + +> **前置说明**:距上一次 review(05-26 15:10)约 **24 小时**。无新 commit。工作区从 22/+2819/-466 行扩大至 23/+3650/-808 行。scripts 新增 1619 行(主要是 generate_daily_report.go +1032 行及其测试 +567 行)。importer smoke 16 PASS 持续。ECharts FAIL 持续 2+ 天。scripts 目录 go test 出现 redeclared main build failure(新增 P1 gap)。 + +#### 本次新增发现 + +- **工作区扩大至 23/+3650/-808 行**:scripts 新增 1619 行(generate_daily_report.go +1032 行、generate_daily_report_test.go +567 行);frontend 新增 ~834 行(Dashboard.tsx +534 行、Explorer.tsx +342 行);cmd/server 新增 ~535 行(main.go +274 行、main_test.go +261 行)。 +- **scripts 目录 go test build failure**:多个脚本(fetch_openrouter.go、fetch_multi_source.go、generate_daily_report.go、fetch_tencent_catalog.go、export_official_seed_json.go、cloudflare_pricing_signature_guard.go)存在 `main redeclared`、`ModelPricing redeclared`、`logger redeclared` 冲突,导致 `go test ./scripts` build FAIL。但 `go build ./cmd/server` 成功,不影响主服务构建。 +- **importer smoke 16 PASS 持续**:verify_importer_smoke.sh 全 PASS,采集链路健康。 +- **verify_phase4 ECharts FAIL 持续**:已持续 2+ 天,唯一 FAIL 项是 `[FAIL] Dashboard 已集成 ECharts`。 + +#### 问题 45(新发现):scripts 目录 go test build failure(redeclared main) + +- **15:10 状态**:`go test ./scripts` 输出大量 `main redeclared in this block` 和 `ModelPricing/logger redeclared` 错误。涉及脚本包括 fetch_openrouter.go、fetch_multi_source.go、generate_daily_report.go、fetch_tencent_catalog.go、export_official_seed_json.go、cloudflare_pricing_signature_guard.go 等。这些脚本在同一 main package 中共享符号。 +- **问题影响**:`go test ./scripts` 无法执行,scripts 目录的单元测试链路断裂;但 `go build ./cmd/server` 不受影响,主服务可正常构建。 +- **优化建议**: + 1. 为 scripts 目录下的各脚本添加 `// +build ignore` build tag 或移至独立包,使每个脚本可独立构建 + 2. 或者在 go test 命令中使用 `go test -tags ignore` 配合 build tag 排除冲突脚本 + 3. 或者将共享类型(ModelPricing、logger)移至 internal/common 包,各脚本独立引用 +- **优先级**:P1 +- **建议验证方法**:修复后执行 `go test ./scripts` 无 build error;或 `go test -tags llm_script ./scripts` 全 PASS。 + +#### 问题 10 状态更新:项目提交停滞(影响次数 23) + +- **15:10 状态**:23 文件 +3650/-808 行核心组件改动未提交,含 generate_daily_report.go +1032 行大改、main_test.go +261 行、前端 Dashboard +534 行等关键业务代码。 +- **问题影响**:versioned truth 与 runtime truth 漂移加剧;scripts build failure 在 commit 前必须修复。 +- **优化建议**:立即按逻辑拆分为 2~3 个 commit(如"server 重构与测试"、"前端 Dashboard/Explorer 扩展"、"日报生成器大改");scripts build failure 需在 commit 前解决。 +- **优先级**:P0 +- **建议验证方法**:修复 scripts build failure 后提交;`git diff --stat HEAD` 变更量大幅收缩。 + +#### 问题 41 状态更新:live_run SUMMARY 缺失(影响次数 5) + +- **15:10 状态**:verify_phase6.sh 在 30s 内退出,未输出 window_size / success_rate / live_run_result SUMMARY。连续超时问题已解决(连续第三次不超时),但 live_run SUMMARY 仍缺失。 +- **问题影响**:Phase 6 稳定性窗口 PASS/FAIL 状态无法通过脚本输出确认(但 importer smoke 全 PASS 说明采集链路健康)。 +- **优化建议**:同 05-26 15:10 记录。 +- **优先级**:P1(从 P0 降级,本轮连续超时未复现) +- **建议验证方法**:修正后执行 verify_phase6.sh,确认输出完整 SUMMARY。 + +#### 问题 43 状态更新:verify_phase4 ECharts FAIL(影响次数 2) + +- **15:10 状态**:verify_phase4 ECharts 断言失败已持续 2+ 天,本轮无变化。 +- **结论**:影响次数从 1 更新为 2 次。 + +#### 问题 29 状态更新:已修复(从 current 表移除) + +#### 问题 31 状态更新:已修复(从 current 表移除) + +#### 问题 34 状态更新:已修复(从 current 表移除) + +- **旧缺口**:当 importer smoke 这类局部门禁已经恢复 PASS,但 phase 级主 blocker 已经转移到别的 gate(例如 `live_run` 或 `api_server`)时,输出里没有显式提示“全局 blocker 已切换”。结果是:读者容易继续把 smoke gate 当成当前主 blocker,而忽略真正还在阻断主链路的 gate。 +- **修复**: + 1. 新增 `scripts/review/global_blocker_switch_guard.sh` + 2. 新增 `scripts/review/global_blocker_switch_guard_test.sh` + 3. 新增 `scripts/review/global_blocker_switch_capture_test.sh` + 4. `verify_phase6.sh` 现在维护并输出: + - `BLOCKER_SWITCH class=<...> old=<...> new=<...>` + 5. 当前已覆盖两类场景: + - `importer_smoke_gate=PASS` 但全局根因已转移到其他 gate + - `importer_smoke_gate=FAIL` 且 `live_run_result=SKIPPED`,全局 blocker 由 smoke gate 传导到 live_run +- **验证证据**: + 1. `bash scripts/review/global_blocker_switch_guard_test.sh` → PASS + 2. `bash scripts/review/global_blocker_switch_capture_test.sh` → PASS +- **结论**:问题 34 已关闭;局部 smoke 恢复或局部 smoke 传导导致的全局 blocker 切换,现在都会在 phase 级输出中被显式提示,不再靠读者自己脑补。 +#### 问题 33 状态更新:已修复(从 current 表移除) + +- **旧缺口**:问题 12/32 虽然已经分别处理了 resolved 行清理和 same-day blocker 替换,但仍缺一个更直接的自动撤销机制:如果 review 日志里已经明确写出“问题 X 状态更新:已修复(从 current 表移除)”,current 表就不该继续保留这个问题。否则就会出现‘日志层已证伪,current truth 仍保留’的矛盾。 +- **修复**: + 1. 新增 `scripts/review/backlog_revocation_guard.sh` + 2. 新增 `scripts/review/backlog_revocation_guard_test.sh` + 3. guard 会扫描 backlog 中所有: + - `#### 问题 X 状态更新:已修复(从 current 表移除)` + 并检查 current 表是否仍残留对应 issue id;若残留则直接 FAIL +- **验证证据**: + 1. `bash scripts/review/backlog_revocation_guard_test.sh` → PASS +- **结论**:问题 33 已关闭;已证伪/已宣告移除的 blocker 现在有了自动撤销 guard,不会再继续挂在 current truth 上自相矛盾。 +#### 问题 32 状态更新:已修复(从 current 表移除) + +- **旧缺口**:问题 29 解决了 review 文本层的 same-day blocker switch 提示,但 backlog current truth 层仍没有同步约束。结果是:即使 review 已明确写出 `old -> new` 的 blocker 切换,旧 blocker 仍可能继续留在 current 表里,继续伪装成当前未修复项。 +- **修复**: + 1. 新增 `scripts/review/backlog_blocker_freshness_guard.sh` + 2. 新增 `scripts/review/backlog_blocker_freshness_guard_test.sh` + 3. 规则:一旦 backlog 文本中出现: + - `freshness_hint=same-day-blocker-switch old=<...> new=<...>` + guard 就会检查 current 表中是否还残留 `old` blocker;若残留则直接 FAIL + 4. 这样 same-day blocker 切换不只是在 prose 层有提示,也会约束 current truth 层必须同步更新 +- **验证证据**: + 1. `bash scripts/review/backlog_blocker_freshness_guard_test.sh` → PASS +- **结论**:问题 32 已关闭;同日 blocker 切换后,旧 blocker 不能再继续滞留在 current 表里冒充最新真相。 +- **旧缺口**:问题 18 已经让 no-delta 场景输出 `aging_focus`,但还没有区分一种更尖锐的停滞态:同一天内没有新的主结论 / 没有新的 blocker 切换。此时 review 不只是“没变化”,而是“今天已经 review 过,但仍没有形成新的主判断”,需要更强的风险优先策略。 +- **修复**: + 1. `scripts/review/review_status_summary.sh` 新增: + - `same_day_no_decision_focus=` + 2. 当前输出 top2 形式: + - `same_day_no_decision_focus=::,...` + 3. 新增 `scripts/review/review_same_day_no_decision_test.sh` + 4. 这样 no-delta 摘要不再只给一般 aging_focus,还会单独指出“同日无主结论”场景下最值得优先处理的问题 +- **验证证据**: + 1. `bash scripts/review/review_status_summary_test.sh` → PASS + 2. `bash scripts/review/review_aging_priority_test.sh` → PASS + 3. `bash scripts/review/review_same_day_no_decision_test.sh` → PASS +- **结论**:问题 31 已关闭;同日 no-delta 现在不再只是一般 aging,而有独立的 same-day no-decision 风险优先输出。 +#### 问题 30 状态更新:已修复(从 current 表移除) + +- **旧缺口**:当前链路已经能够把 `precondition_missing` 分类出来,但历史 precondition 样本仍会持续占据最近 7 次窗口。这样即使当前链路已经恢复绿色,success_rate 仍可能被很久以前的“缺钥/缺连接串”样本拖低,导致 release 语义长期停留在 degraded。 +- **修复**: + 1. 在 `collector_stats_window_audit.sh` 中新增: + - `aged_precondition_missing` + - `AGED_PRECONDITION_MINUTES=1440` + 2. 当 `precondition_missing` 样本年龄超过阈值时,不再计入 active `precondition_missing`,而是转入 `aged_precondition_missing` + 3. `SUCCESS_RATE` 的分母会剔除 aged precondition 样本,因此历史前置条件失败不会继续污染当前 release success-rate +- **验证证据**: + 1. `bash scripts/collector_stats_window_audit_test.sh` → PASS + 2. aged 样例输出已含: + - `precondition_missing=0` + - `aged_precondition_missing=1` + 3. `bash scripts/verify_phase6.sh` → `PHASE_RESULT: PASS` +- **结论**:问题 30 已关闭;历史 precondition 样本现在会老化出 active release 窗口,不再持续拖低当前 success-rate 与 release 判断。 +- **旧缺口**:当同一天内 review 的主 blocker 已经从 A 切换到 B(例如 `xfyun-live` 替换 `sensenova-live`)时,旧 blocker 仍可能继续残留或被复述出去,但报告中没有任何显式 freshness 提示告诉读者“这是同日 blocker 切换,不要继续把旧 blocker 当成当前主 blocker”。 +- **修复**: + 1. 新增 `scripts/review/blocker_switch_guard.sh` + 2. 新增 `scripts/review/blocker_switch_guard_test.sh` + 3. 规则:一旦 review 文本里出现“替换”语义,就必须同时出现: + - `freshness_hint=same-day-blocker-switch old=<...> new=<...>` + 4. 这样同日 blocker 切换会被显式标记为 freshness 事件,而不再只是自然语言描述 +- **验证证据**: + 1. `bash scripts/review/blocker_switch_guard_test.sh` → PASS +- **结论**:问题 29 已关闭;同日 blocker 切换现在会带 freshness_hint,旧 blocker 不再能在 review 链里无提示继续传播。 +### 2026-05-26 15:10(afternoon-review cron) + +> **前置说明**:距上一次 review(05-25 15:10)约 **24 小时**。本轮距上次 afternoon review 无新 commit,工作区变更从 19 文件 +1372/-281 行增长到 22 文件 +2819/-466 行。verify_phase6.sh 连续超时问题(本轮跨三次 review 的 05-25 记录)本轮首次解决,importer smoke 全 PASS;但 live_run SUMMARY 仍缺失。PRE_PHASE6 FAIL(verify_phase4 ECharts 断言失败)。go test 全 PASS。 + +#### 本次新增发现 + +- **verify_phase6.sh 连续超时问题本轮消失**:本轮执行 `timeout 60 bash scripts/verify_phase6.sh` 在 60s 内完成,importer smoke 8 组全 PASS(coreshub/huawei-maas/baichuan/lingyiwanwu/sensenova/xfyun/bytedance 各 fixture+live PASS),gate PASS。但 live_run 仅触发 smokerun,脚本在 60s 内退出,**未输出 window_size / success_rate / live_run_result SUMMARY**。 +- **PRE_PHASE6 FAIL,根因是 verify_phase4 ECharts 断言失败**:`verify_pre_phase6.sh` → `PRE_PHASE6_RESULT: FAIL`,唯一 FAIL 项是 `[FAIL] Dashboard 已集成 ECharts`。Phase 1 PASS(9/9)、Phase 2 PASS(9/9)、Phase 3 PASS(17/17)、Phase 5 PASS(15/15)。 +- **工作区变更量增长**:22 文件 +2819/-466 行(含 cmd/server BasicAuth 重构 +261 行测试、main_test.go +261 行、前端 Dashboard/Explorer +876 行、日报生成器 +229/- 行),BACKLOG 本身也在未提交列表中。 +- **新增 untracked 项**:scripts/secret_gate_lib.sh(1846 字节)、scripts/secret_gate_test.sh(1823 字节)、scripts/testdata/empty.dockerignore(19 字节)、.agent/、.serena/、.dockerignore,均无门禁覆盖。 + +#### 问题 10 状态更新:项目提交停滞(影响次数 22) + +- **15:10 状态**:22 文件 +2819/-466 行核心组件改动未提交,含 cmd/server BasicAuth/IP 限速/apiError 重构、main_test.go +261 行、前端 Dashboard/Explorer 大改(+534/-、+342/- 行)、日报生成器(+229/- 行)。BACKLOG 本身也在未提交列表中。 +- **问题影响**:versioned truth 与 runtime truth 漂移加剧;一旦工作区丢失则核心组件改动无法恢复;BACKLOG 持续未收敛使 review 成本递增。 +- **优化建议**:立即按逻辑拆分为 2~3 个 commit(如"server 重构与测试"、"前端 Dashboard/Explorer 扩展"、"日报生成器与门禁改进");review prompt 应在工作区变更量超过阈值时自动提升 commit 停滞优先级。 +- **优先级**:P0 +- **建议验证方法**:提交后检查 `git log --oneline` 出现新提交,`git diff --stat HEAD` 变更量大幅收缩。 + +#### 问题 41 状态更新:从"连续超时"降级为"live_run SUMMARY 缺失"(影响次数 4) + +- **15:10 状态**:连续超时未在本轮复现(importer smoke 全 PASS,gate PASS),但 live_run SUMMARY(window_size / success_rate / live_run_result)仍未输出,脚本在 smokerun 后 60s 内退出。 +- **问题影响**:Phase 6 稳定性窗口 PASS/FAIL 状态无法确认;无法判断 05-25 的三次超时是外部文档站卡死还是脚本性能退化。 +- **优化建议**: + 1. 调查 verify_phase6.sh live_run 未输出完整 SUMMARY 的根因(60s 内退出但未打印 window / success_rate / live_run_result) + 2. 为 verify_phase6.sh 增加单次检查的独立超时控制,避免单次检查卡死导致整脚本超时 + 3. 在 verify_phase6.sh 输出中增加"当前检查进度"标记 +- **优先级**:P0 → P1(本轮 importer smoke 全 PASS 说明不是持续卡死,但 live_run SUMMARY 缺失仍是 P1) +- **建议验证方法**:修正后执行 verify_phase6.sh,确认能在 <120s 内输出完整 SUMMARY(含 window_size / success_rate / live_run_result)。 + +#### 问题 42 状态更新:已修复(从 backlog current 表移除) + +- **15:10 状态**:verify_phase6.sh 连续超时未在本轮复现,importer smoke 全 PASS。05-25 的三次连续超时更接近外部文档站临时卡死而非脚本性能退化。 +- **结论**:问题 42 从 current 表移除,归档至 review 日志。 + +#### 问题 43(新发现):verify_phase4 ECharts 集成断言失败(历史遗留 P2) + +- **15:10 状态**:`[FAIL] Dashboard 已集成 ECharts` 是 verify_phase4 的唯一 FAIL 项。Dashboard.tsx 中已引入 `import * as echarts from 'echarts'` 和 `echarts.init()` 逻辑,但 verify 脚本断言逻辑与实际代码行为不匹配。 +- **问题影响**:导致 PRE_PHASE6 整体 FAIL;但不影响主采集链路(Phase 1/2/3 全 PASS,importer smoke 全 PASS);历史遗留问题(首现于 05-25 15:10 systematic review)。 +- **优化建议**: + 1. 更新 verify_phase4 中 ECharts 集成断言逻辑,使其与当前 Dashboard.tsx 的 echarts 使用方式一致 + 2. 或者确认当前代码是否真正满足"已集成 ECharts"语义,若不满足则完成集成 + 3. 考虑将 ECharts 相关断言降级为 WARNING 而非 FAIL,以区分"历史遗留 P2"与"真实 blocker" +- **优先级**:P2 +- **建议验证方法**:`bash scripts/verify_phase4.sh` → SUMMARY pass=10 fail=0 warn=0,PRE_PHASE6_RESULT: PASS。 + +#### 问题 44(新发现):新增 scripts 无门禁覆盖 + +- **15:10 状态**:scripts/secret_gate_lib.sh(1846 字节)、scripts/secret_gate_test.sh(1823 字节)、scripts/testdata/empty.dockerignore 为新增 untracked 项,无对应 verify 门禁验证其正确性。 +- **问题影响**:新增安全类脚本无法确认是否正确落地;一旦工作区切换或代码丢失,这些脚本的存在和正确性无法追溯。 +- **优化建议**: + 1. 为 secret_gate_lib.sh / secret_gate_test.sh 建立对应的 smoke gate 或单元测试门禁 + 2. 考虑在 verify_phase5 或 verify_phase6 中增加对新 scripts 目录的覆盖检查 +- **优先级**:P2 +- **建议验证方法**:执行 `bash scripts/secret_gate_test.sh` 验证其正确性,并确认门禁已纳入综合验收。 + +#### 问题 13 状态更新:untracked 核心代码重新活跃(影响次数 14) + +- **15:10 状态**:scripts/secret_gate_lib.sh / secret_gate_test.sh 为新增 untracked 安全类脚本;BACKLOG 本身也在未提交列表中;.agent/、.serena/ 等目录长期未治理。 +- **问题影响**:同问题 10;untracked 列表持续增长增加了 versioned truth 漂移风险。 +- **优化建议**:同问题 10;尽快提交工作区变更,清理非必要 untracked 项。 +- **优先级**:P0 +- **建议验证方法**:提交后 `git status --short` 中 untracked 列表显著收缩。 + +#### 问题 38 状态更新:PRE_PHASE6_RESULT 标签冲突(影响次数 4) + +- **15:10 状态**:verify_phase4 ECharts 断言失败导致 PRE_PHASE6 FAIL;但 verify_phase4 内部 SUMMARY 显示 pass=9 fail=1 warn=0,说明是单一断言失败而非系统性卡死。 +- **问题影响**:PRE_PHASE6 FAIL 的根因已明确为 verify_phase4 ECharts 断言问题(历史 P2),不影响主链路;但标签冲突使 reviewer 需要额外下钻才能判断真实阶段。 +- **优化建议**:将 verify_phase4 中的 ECharts 相关断言降级为 WARNING,或更新断言逻辑使其与当前 Dashboard.tsx echarts 使用方式一致。 +- **优先级**:P1 +- **建议验证方法**:verify_phase4 中 ECharts 断言修复后,PRE_PHASE6_RESULT 应回到 PASS。 + +### 2026-05-25 15:10(afternoon-review cron,第 41 次 review) + +> **前置说明**:距上一次 review(05-25 08:59)约 **6 小时 11 分钟**。本轮无新 delta:working tree 仍 19 文件未提交(与 08:59 systematic review 完全一致),无新 commit。verify_phase6.sh 第三次连续超时(09:06 morning → 09:06 systematic → 15:10 afternoon),Phase 6 live blocker 状态完全无法确认。Phase 1~5 PASS,go test 全 PASS,日报已生成,但所有 systematic review 修复落地项(.dockerignore、runtimeVisibility、BasicAuth、Explorer.tsx 部分修复)均未 commit。 + +#### 本次新增发现 + +- **verify_phase6.sh 第三次连续超时**:本轮执行 `timeout 180 bash scripts/verify_phase6.sh`,>200s 无输出,连续第三次(09:06 morning / 09:06 systematic / 15:10 afternoon)。Phase 6 live blocker 状态(Zhipu 403 是否仍活跃、是否已消失或切换到新外部源)完全无法确认。 +- **Phase 1~5 门禁全 PASS**:`verify_pre_phase6.sh` 输出 `PRE_PHASE6_RESULT: PASS`,SUMMARY pass=15 fail=0 warn=0,与历史一致。 +- **Working tree 状态与 08:59 systematic review 完全一致**:19 文件 +1372/-281 行仍未提交,包含 .dockerignore、runtimeVisibility.ts、BasicAuth 实现、Explorer.tsx 部分修复等 systematic review 所有 P0/P1 修复落地项。 +- **systematic review P0-3 修复已落地但未 commit**:`.dockerignore` 已创建(285 字节,12:03 创建,artifact-present),`frontend/src/lib/runtimeVisibility.ts` + `runtimeVisibility.test.ts` 已创建。 +- **Explorer.tsx fallback 修复尚未完整验证**:runtimeVisibility.ts 已就绪但 Explorer.tsx 中只引入了部分 notice 构建逻辑,未完全实现"禁止静默 fallback"的 P0-2 修复目标。 +- **整体项目状态无新 delta**:距上次 review 6+ 小时,无新 commit,无新 runtime 证据,主链路健康(API 200,日报已生成)。 + +#### 问题 42(新发现):verify_phase6.sh 第三次连续超时,Phase 6 live blocker 状态完全不明 + +- **15:10 状态**:连续三次 verify_phase6.sh 超时(09:06 morning / 09:06 systematic / 15:10 afternoon),均无法在 180s 内完成并输出 Phase 6 SUMMARY。这不是偶发性问题,而是持续性卡死——可能存在外部文档站持续卡死或脚本本身性能退化。 +- **问题影响**: + - Phase 6 综合门禁 PASS/FAIL 完全不明,连续三次 review 均无法给出准确的阶段判断 + - 无法确认 Zhipu 403 blocker 是否仍活跃、是否已消失还是切换到新的外部源 + - 外部文档站可能存在新的持续卡死,需要立即调查超时根因 +- **优化建议**: + 1. 调查 verify_phase6.sh 超时根因:单次外部文档站卡死 vs 整体脚本性能退化 + 2. 为 verify_phase6.sh 增加单次检查的独立超时控制,避免单次检查卡死导致整脚本超时 + 3. 在 verify_phase6.sh 输出中增加"当前检查进度"标记,方便定位卡死环节 + 4. 在 verify_phase6.sh 中为连续超时的外部 URL 建立快速失败策略 +- **优先级**:P0 +- **建议验证方法**:修正后执行 verify_phase6.sh,确认能在 <120s 内完成并输出完整 SUMMARY(含 window_size / success_rate / live_run_result) + +#### 问题 40 状态更新:优先级升级,影响次数更新 + +- **15:10 状态**:问题 40 自 08:51 首现,已持续 6+ 小时未解决,working tree 仍包含 systematic review 所有 P0/P1 修复落地项。优先级从 P2 升级为 P1(因为现在包含 P0 修复落地项的未 commit 风险);影响次数从 2 更新为 3 次。 +- **结论**:优先级从 P2 升级为 P1,影响次数从 2 更新为 3 次。 + +#### 问题 38 状态更新:PRE_PHASE6_RESULT 标签冲突仍待系统性修复 + +- **15:10 状态**:问题 38 影响次数从 2 更新为 3 次。PRE_PHASE6_RESULT 标签逻辑本身仍未系统性修复。 +- **结论**:影响次数从 2 更新为 3 次。 + +#### 问题 39 状态更新:日报时间戳异常仍未修复 + +- **15:10 状态**:问题 39 影响次数从 2 更新为 3 次。generated_at 仍显示 2026-05-25T19:03:55+08:00,比实际时间晚约 10 小时,与 08:51 / 08:59 记录一致。 +- **结论**:影响次数从 2 更新为 3 次。 + +### 2026-05-25 09:06(night-review cron,第 40 次 review) + +> **前置说明**:距上一次 review(05-25 08:59)约 **7 分钟**。本轮属于"无新 delta 且 verify_phase6.sh 异常超时":无新 commit,Phase 1~5 门禁仍全 PASS,但 verify_phase6.sh 连续两次执行超时(>180s)导致 Phase 6 live blocker 状态无法确认。BACKLOG 文件 uncommitted 已持续 75 分钟+(08:51 → 08:59 → 09:06)。 + +#### 本次新增发现 + +- **verify_phase6.sh 连续两次超时**:本轮 review 两次执行 `bash scripts/verify_phase6.sh`,第一次在 90s 内完成了前 30 个 importer smoke 全 PASS 但未输出最终 SUMMARY;第二次直接超时(>180s 无法完成)。Phase 6 live blocker 状态(Zhipu 403 是否仍活跃)无法本轮真实验证。 +- **Phase 1~5 门禁仍然全 PASS**:`verify_pre_phase6.sh` 输出 `PRE_PHASE6_RESULT: PASS`,与上一轮一致,无变化。 +- **BACKLOG 文件 uncommitted 已持续 75 分钟+**:问题 40 从 08:51 首现,08:59 仍存在,09:06 仍未解决,已跨三轮 review 无收敛动作。 +- **日报时间戳异常仍未改善**:`daily_report_2026-05-25.md` 的 `generated_at: 2026-05-25T19:03:55+08:00` 比实际时间(09:06)晚约 10 小时,与 08:51 / 08:59 记录一致。 + +#### 问题 41(新发现):verify_phase6.sh 连续超时导致 Phase 6 live blocker 状态无法确认 + +- **09:06 状态**:本轮 review 连续两次执行 `bash scripts/verify_phase6.sh`,均无法在合理时间内完成。第一次在前 90s 内完成了 30 个 importer smoke 全 PASS 但未输出最终 SUMMARY;第二次直接超时(>180s 无法完成)。 +- **问题影响**: + - Phase 6 综合门禁 PASS/FAIL 状态无法确认,reviewer 无法给出准确的阶段判断 + - 上一轮(08:59)记录的 Zhipu 403 blocker 是否仍活跃、是否已切换,本轮无法验证 + - 超时可能与 Zhipu 403 或其他外部文档站卡死有关,需要调查根因 +- **优化建议**: + 1. 调查 verify_phase6.sh 超时根因:单次外部文档站拉取卡死 vs 整体脚本性能退化 + 2. 为 verify_phase6.sh 增加单次检查的独立超时控制,避免单次检查卡死导致整脚本超时 + 3. 在 verify_phase6.sh 输出中增加"当前检查进度"标记,方便定位卡死环节 +- **优先级**:P1 +- **建议验证方法**:修正后执行 verify_phase6.sh,确认能在 <120s 内完成并输出完整 SUMMARY(含 window_size / success_rate / live_run_result) + +#### 问题 37 状态更新:外部文档站故障仍无系统化降级 + +- **09:06 状态**:问题 37 仍活跃,影响次数从 3 更新为 4 次。本轮 verify_phase6 超时可能与外部文档站卡死有关(可能是 Zhipu 403 或其他源),blocker 在不同外部源之间游走的模式持续。 +- **结论**:从"3 次"更新为"4 次"。 + +#### 问题 39 状态更新:日报时间戳异常仍未改善 + +- **09:06 状态**:generated_at 仍显示 2026-05-25T19:03:55+08:00,比实际时间晚约 10 小时,无修复动作。 +- **结论**:影响次数从 1 更新为 2 次。 + +#### 问题 40 状态更新:BACKLOG uncommitted 已持续 75 分钟+ + +- **09:06 状态**:问题 40 已从 08:51 首现(morning review 修改 BACKLOG 后未 commit),08:59 仍存在,09:06 仍未解决,跨三轮 review 无收敛动作。 +- **结论**:影响次数从 1 更新为 2 次。 + + ## Review 日志 ### 2026-05-29 15:10(afternoon-review cron) diff --git a/scripts/apply_migration.sh b/scripts/apply_migration.sh index 3e64e6c..9e7c0b9 100755 --- a/scripts/apply_migration.sh +++ b/scripts/apply_migration.sh @@ -4,14 +4,8 @@ set -euo pipefail ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/.." && pwd)" cd "$ROOT_DIR" -if [[ -f ".env.local" ]]; then - # shellcheck disable=SC1091 - source ".env.local" -fi -if [[ -f ".env" ]]; then - # shellcheck disable=SC1091 - source ".env" -fi +while IFS= read -r kv; do export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env.local") +while IFS= read -r kv; do key="${kv%%=*}"; [[ -n "$key" && -n "${!key:-}" ]] && continue; export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env") if [[ -z "${DATABASE_URL:-}" ]]; then echo "DATABASE_URL 未设置" >&2 diff --git a/scripts/env_precedence_test.sh b/scripts/env_precedence_test.sh new file mode 100755 index 0000000..c87ee84 --- /dev/null +++ b/scripts/env_precedence_test.sh @@ -0,0 +1,25 @@ +#!/usr/bin/env bash +set -euo pipefail + +ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/.." && pwd)" +cd "$ROOT_DIR" + +TMP_DIR="$(mktemp -d)" +trap 'rm -rf "$TMP_DIR"' EXIT + +cat > "$TMP_DIR/.env.local" <<'EOF' +LOCAL_ALPHA=test-placeholder-value +LOCAL_BETA=real-db +EOF +cat > "$TMP_DIR/.env" <<'EOF' +LOCAL_ALPHA= +LOCAL_BETA= +EOF + + + +unset LOCAL_ALPHA LOCAL_BETA || true +while IFS= read -r kv; do export "$kv"; done < <(scripts/load_project_env.sh "$TMP_DIR/.env.local") +while IFS= read -r kv; do key="${kv%%=*}"; [[ -n "$key" && -n "${!key:-}" ]] && continue; export "$kv"; done < <(scripts/load_project_env.sh "$TMP_DIR/.env") +[[ "$LOCAL_ALPHA" == "test-placeholder-value" ]] +[[ "$LOCAL_BETA" == "real-db" ]] diff --git a/scripts/load_project_env.sh b/scripts/load_project_env.sh new file mode 100755 index 0000000..aa4e6f8 --- /dev/null +++ b/scripts/load_project_env.sh @@ -0,0 +1,21 @@ +#!/usr/bin/env bash +set -euo pipefail + +PATH_ARG="${1:-}" +[[ -n "$PATH_ARG" && -f "$PATH_ARG" ]] || exit 0 + +python3 - <<'PY' "$PATH_ARG" +from pathlib import Path +import sys + +for raw in Path(sys.argv[1]).read_text().splitlines(): + s = raw.strip() + if not s or s.startswith('#') or '=' not in s: + continue + key, value = s.split('=', 1) + key = key.strip() + value = value.strip().strip('"').strip("'") + if not key or not value: + continue + print(f"{key}={value}") +PY diff --git a/scripts/rebuild_historical_report.sh b/scripts/rebuild_historical_report.sh index 8e0c279..332c45d 100755 --- a/scripts/rebuild_historical_report.sh +++ b/scripts/rebuild_historical_report.sh @@ -12,14 +12,8 @@ fi REPORT_DATE="$1" shift || true -if [[ -f ".env.local" ]]; then - # shellcheck disable=SC1091 - source ".env.local" -fi -if [[ -f ".env" ]]; then - # shellcheck disable=SC1091 - source ".env" -fi +while IFS= read -r kv; do export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env.local") +while IFS= read -r kv; do key="${kv%%=*}"; [[ -n "$key" && -n "${!key:-}" ]] && continue; export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env") REPORT_DATE="$REPORT_DATE" \ REPORT_RUN_KIND="historical_rebuild" \ diff --git a/scripts/report_state_tracking_test.sh b/scripts/report_state_tracking_test.sh index 53b62e3..15e13d7 100755 --- a/scripts/report_state_tracking_test.sh +++ b/scripts/report_state_tracking_test.sh @@ -5,8 +5,9 @@ set -euo pipefail ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/.." && pwd)" cd "$ROOT_DIR" -source .env.local 2>/dev/null || true -source .env 2>/dev/null || true +while IFS= read -r kv; do export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env.local") +while IFS= read -r kv; do key="${kv%%=*}"; [[ -n "$key" && -n "${!key:-}" ]] && continue; export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env") +source scripts/report_utils.sh source scripts/report_utils.sh if [[ -z "${DATABASE_URL:-}" ]]; then diff --git a/scripts/restore.sh b/scripts/restore.sh index 3666639..b5e1984 100755 --- a/scripts/restore.sh +++ b/scripts/restore.sh @@ -15,14 +15,8 @@ if [[ ! -f "$BACKUP_FILE" ]]; then exit 1 fi -if [[ -f ".env.local" ]]; then - # shellcheck disable=SC1091 - source ".env.local" -fi -if [[ -f ".env" ]]; then - # shellcheck disable=SC1091 - source ".env" -fi +while IFS= read -r kv; do export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env.local") +while IFS= read -r kv; do key="${kv%%=*}"; [[ -n "$key" && -n "${!key:-}" ]] && continue; export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env") DB_URL="${DATABASE_URL:-host=/var/run/postgresql dbname=llm_intelligence user=long sslmode=disable}" diff --git a/scripts/run_daily.sh b/scripts/run_daily.sh index bffabeb..5671893 100755 --- a/scripts/run_daily.sh +++ b/scripts/run_daily.sh @@ -5,14 +5,8 @@ set -euo pipefail PROJECT_DIR="/home/long/project/llm-intelligence" . "$PROJECT_DIR/scripts/report_utils.sh" -if [[ -f "$PROJECT_DIR/.env.local" ]]; then - # shellcheck disable=SC1091 - source "$PROJECT_DIR/.env.local" -fi -if [[ -f "$PROJECT_DIR/.env" ]]; then - # shellcheck disable=SC1091 - source "$PROJECT_DIR/.env" -fi +while IFS= read -r kv; do export "$kv"; done < <("$PROJECT_DIR/scripts/load_project_env.sh" "$PROJECT_DIR/.env.local") +while IFS= read -r kv; do [[ -n "${kv%%=*}" && -n "${!kv%%=*:-}" ]] && continue; export "$kv"; done < <("$PROJECT_DIR/scripts/load_project_env.sh" "$PROJECT_DIR/.env") DB_URL="${DATABASE_URL:-host=/var/run/postgresql dbname=llm_intelligence user=long sslmode=disable}" export DATABASE_URL="$DB_URL" REPORT_DATE="$(report_date_value)" diff --git a/scripts/run_intel_pipeline.sh b/scripts/run_intel_pipeline.sh index 7a4cf3f..c3f5a63 100755 --- a/scripts/run_intel_pipeline.sh +++ b/scripts/run_intel_pipeline.sh @@ -4,14 +4,8 @@ set -euo pipefail ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/.." && pwd)" cd "$ROOT_DIR" -if [[ -f ".env.local" ]]; then - # shellcheck disable=SC1091 - source ".env.local" -fi -if [[ -f ".env" ]]; then - # shellcheck disable=SC1091 - source ".env" -fi +while IFS= read -r kv; do export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env.local") +while IFS= read -r kv; do key="${kv%%=*}"; [[ -n "$key" && -n "${!key:-}" ]] && continue; export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env") if [[ -z "${DATABASE_URL:-}" ]]; then echo "DATABASE_URL 未设置" >&2 diff --git a/scripts/run_intraday_discovery_watch.sh b/scripts/run_intraday_discovery_watch.sh index 12ef443..5487fae 100644 --- a/scripts/run_intraday_discovery_watch.sh +++ b/scripts/run_intraday_discovery_watch.sh @@ -4,14 +4,8 @@ set -euo pipefail ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/.." && pwd)" cd "$ROOT_DIR" -if [[ -f ".env.local" ]]; then - # shellcheck disable=SC1091 - source ".env.local" -fi -if [[ -f ".env" ]]; then - # shellcheck disable=SC1091 - source ".env" -fi +while IFS= read -r kv; do export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env.local") +while IFS= read -r kv; do key="${kv%%=*}"; [[ -n "$key" && -n "${!key:-}" ]] && continue; export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env") if [[ -z "${DATABASE_URL:-}" ]]; then echo "DATABASE_URL 未设置" >&2 diff --git a/scripts/run_intraday_price_watch.sh b/scripts/run_intraday_price_watch.sh index ecd8e6a..43a7c30 100644 --- a/scripts/run_intraday_price_watch.sh +++ b/scripts/run_intraday_price_watch.sh @@ -4,14 +4,8 @@ set -euo pipefail ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/.." && pwd)" cd "$ROOT_DIR" -if [[ -f ".env.local" ]]; then - # shellcheck disable=SC1091 - source ".env.local" -fi -if [[ -f ".env" ]]; then - # shellcheck disable=SC1091 - source ".env" -fi +while IFS= read -r kv; do export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env.local") +while IFS= read -r kv; do key="${kv%%=*}"; [[ -n "$key" && -n "${!key:-}" ]] && continue; export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env") if [[ -z "${DATABASE_URL:-}" ]]; then echo "DATABASE_URL 未设置" >&2 diff --git a/scripts/run_real_pipeline.sh b/scripts/run_real_pipeline.sh index fd59b17..105c603 100755 --- a/scripts/run_real_pipeline.sh +++ b/scripts/run_real_pipeline.sh @@ -4,15 +4,8 @@ set -euo pipefail ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/.." && pwd)" . "$ROOT_DIR/scripts/report_utils.sh" cd "$ROOT_DIR" - -if [[ -f ".env.local" ]]; then - # shellcheck disable=SC1091 - source ".env.local" -fi -if [[ -f ".env" ]]; then - # shellcheck disable=SC1091 - source ".env" -fi +while IFS= read -r kv; do export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env.local") +while IFS= read -r kv; do key="${kv%%=*}"; [[ -n "$key" && -n "${!key:-}" ]] && continue; export "$kv"; done < <("$ROOT_DIR/scripts/load_project_env.sh" ".env") if [[ -z "${DATABASE_URL:-}" ]]; then echo "DATABASE_URL 未设置" >&2