Files
llm-intelligence/RUNBOOK.md
phamnazage-jpg 77e6610fd2
Some checks failed
CI / test (push) Has been cancelled
chore: prepare repository for publishing
2026-05-13 14:42:45 +08:00

2.1 KiB
Raw Blame History

LLM Intelligence Hub - 运维手册

版本: v1.0
日期: 2026-05-10
适用版本: Phase 1


服务启停

启动全部服务

docker-compose up -d

停止服务

docker-compose down

查看日志

docker-compose logs -f app
docker-compose logs -f db

日常巡检

数据库健康

psql "$DATABASE_URL" -c "SELECT COUNT(*) FROM models WHERE deleted_at IS NULL"
psql "$DATABASE_URL" -c "SELECT source, success, created_at FROM collector_stats ORDER BY created_at DESC LIMIT 5"

日报检查

ls -la reports/daily/daily_report_$(date +%Y-%m-%d).md

磁盘空间

df -h /var/lib/postgresql
df -h /tmp

故障排查

采集器失败

  1. 检查 API Key: echo $OPENROUTER_API_KEY
  2. 检查网络: curl https://openrouter.ai/api/v1/models
  3. 查看日志: tail /tmp/llm_hub_daily_*.log

数据库连接失败

  1. 检查 PostgreSQL 状态: pg_isready
  2. 检查连接串: echo $DATABASE_URL
  3. 检查权限: psql -c "\du"

日报未生成

  1. 检查 cron: crontab -l | grep llm-intelligence
  2. 手动运行: bash scripts/run_daily.sh
  3. 检查降级报告: ls reports/daily/*.md | tail -1

前端无法访问

  1. 检查 Nginx: docker-compose ps nginx
  2. 检查 dist: ls frontend/dist/
  3. 检查端口: netstat -tlnp | grep 80

备份恢复

手动备份

bash scripts/backup.sh

手动恢复

gunzip < backup_file.sql.gz | psql "$DATABASE_URL"

定时备份 (cron)

0 2 * * * cd /path/to/llm-intelligence && bash scripts/backup.sh >> /tmp/backup.log 2>&1

监控指标

指标 告警阈值 检查命令
模型数 < 300 SELECT COUNT(*) FROM models
采集成功率 < 95% SELECT success_rate FROM collector_stats
数据库连接 失败 pg_isready
磁盘空间 > 80% df -h

扩容指南

垂直扩容

增加 PostgreSQL 内存和 CPU。

水平扩容

使用读写分离或分片Phase 2+)。


联系信息

  • 维护者: 宰相
  • 项目路径: /home/long/project/llm-intelligence