系统稳定性问题总结

1.重要接口
2.重要场景
3.压测方案
4.构造测试数据
5.去掉免登去模拟请求,压测自己的接口
6.评估压测
历史高峰值三倍
或预估流量三倍
7.执行压测,线上服务器
8.晚上10点以后
9.压测时关注
系统监控,业务监控,cpu,内存,容量上限
压到系统报警
10.整理压测报告
11.压测接口列表
rt,内存,cpu
12.提交审核前提前沟通,有没有问题

常见问题:
1.慢sql,sql包含业务逻辑,多表联合查询,索引不合理,使用like
统计可以用like,主业务不能用like,不用select *,只查单表
2.读写比高的用redis,秒杀分布式锁,不要用数据库,用redis
统计数据不用数据库实时查,用定时服务
3.内部服务调用用prc,不用http
4.静态资源
5.资源消耗到ecs,别消耗到数据库中,数据库扩容比较麻烦,ecs更容易扩容
6.http也是有连接池的

系统稳定性问题总结