线上运营
# 怎么快速定位系统的瓶颈
- 压测(性能测试),项目上线之前测评系统的压力
- 压测目的:给出系统当前的性能状况;定位系统性能瓶颈或潜在性能瓶颈
- 指标:响应时间、 QPS、并发数、吞吐量、 CPU利用率、内存使用率、磁盘IO、错误率
- 压测工具:LoadRunner、Apache Jmeter …
- 后端工程师:根据压测的结果进行解决或调优(接口慢、代码报错、并发达不到要求…)
- 监控工具、链路追踪工具,项目上线之后监控
- 监控工具:Prometheus+Grafana
- 链路追踪工具:skywalking、Zipkin
- 线上诊断工具Arthas(阿尔萨斯),项目上线之后监控、排查
- 官网:https://arthas.aliyun.com/
- 核心功能:
当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决: 0.这个类从哪个jar包加载的?为什么会报各种类相关的Exception? 1.我改的代码为什么没有执行到?难道是我没commit?分支搞错了? 2.遇到问题无法在线上debug,难道只能通过加日志再重新发布吗? 3.线上遇到某个用户的数据处理有问题,但线上同样无法dbug,线下无法重现! 4.是否有一个全局视角来查看系统的运行状况? 5.有什么办法可以监控到M的实时运行状态? 6.怎么快速定位应用的热点,生成火焰图? 7.怎样直接从VM内查找某个类的实例?
上次更新: 2025/4/20 13:17:48