网络维护操作手册内容怎么写?网站搭建人手一份的实用清单

网站久了,总免不了半夜被告警邮件叫醒:数据库连接超时、CDN节点挂了、SSL证书过期……这时候翻出一份靠谱的网络维护操作手册,比瞎查日志强十倍。

别堆概念,要能马上用

很多手册一上来就列‘网络拓扑图’‘SLA定义’‘KPI考核标准’,看着高大上,真遇到服务器502,根本没法下手。我们平时用的手册,核心就三块:查什么、怎么查、查完干啥。

1. 基础巡检项(每天花5分钟)

– 域名解析是否生效(dig +short yoursite.com
– HTTPS证书剩余天数(echo | openssl s_client -connect yoursite.com:443 2>/dev/null | openssl x509 -noout -dates
– 主机磁盘使用率(df -h | grep '/$'
– Nginx/Apache访问日志最新10行是否有大量5xx(tail -10 /var/log/nginx/error.log

2. 故障速查表(贴在工位或存为浏览器书签)

现象:网站打不开,但ping通,https://打不开
→ 检查证书是否过期(见上)
→ 检查Nginx是否监听443端口(ss -tlnp | grep :443
→ 检查防火墙是否放行(ufw status | grep 443iptables -L -n | grep :443

现象:后台登录慢,数据库报‘Too many connections’
→ 查当前连接数(mysql -e 'show status like "Threads_connected";'
→ 查慢查询(mysqldumpslow -s c -t 5 /var/log/mysql/slow.log
→ 临时释放(mysql -e 'kill $(mysql -e "show processlist;" | grep "Sleep" | head -20 | awk "{print \$1}") 2>/dev/null'

3. 操作留痕,不靠脑子记

每次改配置,别只改完就走。在手册对应条目后加一行:
# 2024-06-12 14:30|升级nginx至1.24.0|/etc/nginx/nginx.conf 增加client_max_body_size 100M
时间、动作、位置、变更点,四要素齐了,三个月后你忘了,同事也能接得住。

手册不是锁在Wiki里的文档,是放在你终端里~/ops/handbook.md、打开就看得到的活文件。每周花10分钟更新一条新踩的坑,半年下来,它就是你网站最硬的底裤。