Files
llm-intelligence/RUNBOOK.md

2.4 KiB

LLM Intelligence Hub - 运维手册

版本: v1.1 日期: 2026-05-21


服务启停

启动全部服务

docker-compose up -d --build

停止服务

docker-compose down

查看日志

docker-compose logs -f app
docker-compose logs -f db

日常巡检

应用健康

curl http://localhost:8080/health
curl http://localhost:8080/api/v1/models

数据库健康

psql "$DATABASE_URL" -c "SELECT COUNT(*) FROM models WHERE deleted_at IS NULL"
psql "$DATABASE_URL" -c "SELECT source, success, created_at FROM collector_stats ORDER BY created_at DESC LIMIT 5"

日报检查

ls -la reports/daily/daily_report_$(date +%Y-%m-%d).md

磁盘空间

df -h /var/lib/postgresql
df -h /tmp

故障排查

采集器失败

  1. 检查 API Key: echo $OPENROUTER_API_KEY
  2. 检查网络: curl https://openrouter.ai/api/v1/models
  3. 查看日志: tail /tmp/llm_hub_daily_*.log

数据库连接失败

  1. 检查 PostgreSQL 状态: pg_isready
  2. 检查连接串: echo $DATABASE_URL
  3. 检查权限: psql -c "\du"

日报未生成

  1. 检查 cron: crontab -l | grep llm-intelligence
  2. 手动执行: bash scripts/run_daily.sh
  3. 检查最近日报: ls reports/daily/*.md | tail -1

前端无法访问

  1. 检查应用容器: docker-compose ps app
  2. 检查首页响应: curl -I http://localhost:8080/
  3. 检查 API 响应: curl http://localhost:8080/api/v1/models
  4. 查看应用日志: docker-compose logs -f app

静态资源 404

  1. 重新构建镜像: docker-compose up -d --build
  2. 本地校验前端构建: cd frontend && npm run build
  3. 确认容器内含有前端产物: docker-compose exec app ls /app/frontend/dist

备份恢复

手动备份

bash scripts/backup.sh

手动恢复

gunzip < backup_file.sql.gz | psql "$DATABASE_URL"

定时备份

0 2 * * * cd /path/to/llm-intelligence && bash scripts/backup.sh >> /tmp/backup.log 2>&1

监控指标

指标 告警阈值 检查命令
模型数 < 300 SELECT COUNT(*) FROM models
采集成功率 < 95% SELECT success_rate FROM collector_stats
数据库连接 失败 pg_isready
磁盘空间 > 80% df -h

联系信息

  • 维护者: 宅相
  • 项目路径: D:\project\llm-intelligence