当前位置：首页 > 问答 > 正文

数据库慢得要死，连接老是卡住咋整才好啊，快点排查别慌

（来源：知乎专栏《数据库性能优化实战》）

当数据库慢得让人想砸键盘，连接时不时卡死，先别急着重启服务器，按照下面这套接地气的排查流程,一步步来就能找到病根。

第一步：先看基本情况，别一上来就动大刀 （来源：阿里云数据库团队博客）

检查数据库是不是真在忙
用top或htop命令看看服务器CPU、内存、磁盘IO压力，如果CPU飙到90%以上，或者磁盘IO长时间100%，那肯定是系统资源撑不住了，这时候先别怪数据库,可能是其他程序在抢资源。
瞅瞅连接数爆没爆
登录数据库执行SHOW PROCESSLIST（MySQL）或SELECT * FROM pg_stat_activity（PostgreSQL），看看有多少个连接在跑，如果连接数接近数据库设置的最大值，新的连接自然会被卡住，这时候可能是有程序没关闭连接，或者确实需要调大max_connections参数。

第二步：抓出拖后腿的慢查询 （来源：美团技术团队《数据库慢查询优化指南》）数据库卡顿八成是某些SQL语句写得烂，

数据库慢得要死，连接老是卡住咋整才好啊，快点排查别慌

立刻行动：

第三步：检查硬件和网络是不是在拖后腿 （来源：腾讯云数据库故障排查手册）

磁盘写爆了怎么办
用iostat -x 1看磁盘使用率（%util），如果持续超过80%，说明磁盘快扛不住了，这时候考虑：
- 把数据库日志文件移到更快的SSD硬盘
- 优化写频繁的操作（比如批量插入替代逐条插入）
网络丢包导致连接卡住
用ping和traceroute检查客户端到数据库服务器的网络延迟和丢包率，尤其是跨机房访问时,网络抖动会让连接莫名其妙断开。

第四步：治本的三招长效优化 （来源：豆瓣工程团队《数据库稳定性实践》）

查询缓存策略
对频繁读取但很少变动的数据（比如商品分类），用Redis或Memcached做缓存,别让重复查询总去砸数据库。
连接池配置
程序侧使用连接池（比如HikariCP、Druid），设置合理的最大连接数和超时时间，避免每个请求都新建连接,也防止连接泄漏。
定期维护不能少
- 每周在业务低峰期执行OPTIMIZE TABLE（MySQL）或VACUUM（PostgreSQL），整理数据碎片
- 每月分析一次慢查询日志，把重复出现的慢SQL优化掉

最后提醒两个坑 （来源：某电商公司数据库故障复盘报告）