说一下JDK的监控和 线上处理的一些case
myzbx 2025-09-01 09:53 5 浏览
一句话总结
JDK监控常用工具包括JConsole、VisualVM、JMC等,用于实时查看内存、线程、GC状态。
线上常见问题处理:内存泄漏通过heap dump分析对象引用链;频繁GC可调整-Xmx/-Xms或更换垃圾回收器;线程死锁用jstack生成线程快照定位;使用Arthas在线诊断方法执行耗时及热更新代码;借助JMX或Prometheus+Grafana实现指标可视化监控。
详细解析
以下是 JDK 监控工具和线上常见问题的处理案例,结合实际场景说明排查思路和解决方法:
一、JDK 监控工具概览
工具 | 用途 | 关键命令/操作 |
jps | 查看 Java 进程的 PID 和主类名 | jps -l |
jstat | 监控堆内存、类加载、GC 统计等 | jstat -gcutil <pid> 1000(每 1 秒输出 GC 统计) |
jstack | 生成线程快照(Dump 线程栈),分析死锁、线程阻塞等 | jstack <pid> > thread.log |
jmap | 生成堆内存快照(Heap Dump),分析内存泄漏 | jmap -dump:format=b,file=heap.hprof <pid> |
jinfo | 查看或修改 JVM 参数 | jinfo -flags <pid> |
jcmd | 多功能命令(生成堆转储、查看线程栈、触发 GC 等) | jcmd <pid> GC.run(触发 Full GC) |
JConsole | 图形化监控堆内存、线程、类、MBean 等 | 通过jconsole启动 |
VisualVM | 功能更强大的图形化工具(支持堆转储分析、线程分析、抽样器等) | 通过jvisualvm启动 |
Java Flight Recorder (JFR) | 低开销的性能分析工具(记录 CPU、内存、IO 等事件) | jcmd <pid> JFR.start duration=60s filename=recording.jfr |
二、线上常见问题处理案例
Case 1:CPU 使用率飙升
- 现象:服务器 CPU 持续 100%,应用响应变慢。
- 排查步骤:
定位高 CPU 进程:
top -c # 查看进程 CPU 占用(找到 Java 进程 PID)
定位高 CPU 线程:
top -H -p <pid> # 查看该进程下的线程 CPU 占用,记录线程 ID(十进制)
转换线程 ID 为十六进制:
printf "%x\n" <线程ID> # 得到十六进制值(如 0x2a3b)
分析线程栈:
jstack <pid> > thread.log
grep -A 20 'nid=0x2a3b' thread.log # 查看该线程的栈信息
- 常见原因:死循环:代码中存在无限循环(如while(true)未休眠或退出条件错误)。锁竞争:线程频繁争抢锁(如synchronized块内执行耗时操作)。频繁 GC:Full GC 导致 CPU 飙升(需结合 GC 日志分析)。
- 解决:优化代码逻辑(如避免死循环、减少锁粒度)。使用异步处理或线程池控制并发。
Case 2:内存泄漏(OOM)
- 现象:频繁 Full GC,最终抛出OutOfMemoryError: Java heap space。
- 排查步骤:查看 GC 情况:
jstat -gcutil <pid> 1000 # 观察 Old 代占用是否持续增长
生成堆转储文件:
jmap -dump:live,format=b,file=heap.hprof <pid> # 注意:live 参数会触发 Full GC
- 使用 MAT 分析堆转储:打开heap.hprof,查找占用内存最大的对象。查看对象引用链,定位未释放的集合或缓存(如静态HashMap持续添加元素)。
- 常见原因:静态集合未清理:如全局缓存未设置过期策略。资源未关闭:数据库连接、文件流未释放。第三方库内存泄漏:如某些框架未正确释放资源。
- 解决:修复代码,及时释放无用对象。使用弱引用(WeakReference)或限制缓存大小。
Case 3:线程死锁
- 现象:应用无响应,但 CPU 和内存使用正常。
- 排查步骤:
生成线程快照:
jstack <pid> > thread.log
查找死锁标记:
grep -i 'deadlock' thread.log # 查看是否有 "Found one Java-level deadlock"
分析死锁线程栈:查看线程持有的锁和等待的锁,找到循环等待的锁链。
示例:
// 线程 1 持有锁 A,等待锁 B
synchronized (A) {
synchronized (B) { ... } // 线程 1 在此阻塞
}
// 线程 2 持有锁 B,等待锁 A
synchronized (B) {
synchronized (A) { ... } // 线程 2 在此阻塞
}
- 解决:
- 调整锁顺序,保证所有线程按相同顺序获取锁。
- 使用超时锁(如ReentrantLock.tryLock())。
Case 4:Metaspace 溢出
- 现象:抛出OutOfMemoryError: Metaspace。
排查步骤:查看 Metaspace 使用情况:
jstat -gcutil <pid> 1000 # 关注 M(Metaspace)列
分析类加载情况:
jcmd <pid> VM.classloader_stats # 查看加载的类数量
生成堆转储(可选):
jmap -dump:format=b,file=meta.hprof <pid>
- 常见原因:
动态生成类:如大量使用 CGLib、反射生成代理类。
重复加载类:类加载器未释放(如 OSGi 环境或热部署工具)。
- 解决:
增大 Metaspace 大小(-XX:MaxMetaspaceSize=512m)。
优化代码,避免重复生成类。
Case 5:频繁 Full GC
- 现象:GC 日志中频繁出现Full GC,应用停顿明显。
- 排查步骤:
查看 GC 原因:
-XX:+PrintGCDetails -XX:+PrintGCDateStamps # 在 GC 日志中查看触发原因
常见触发场景:
晋升失败:Young 代存活对象过多,Old 代空间不足。
内存碎片:CMS 回收器未开启内存压缩。
优化方向:
增大 Old 代空间(调整-Xmx或-XX:NewRatio)。
更换为 G1 回收器(自动处理碎片)。
启用 CMS 内存压缩(-XX:+
UseCMSCompactAtFullCollection)。
相关推荐
- 半导体行业术语缩写词典总结-JKL_半导体词汇缩写表
-
作为半导体行业新人来说,最痛苦的莫过于各种缩写词术语了,有的缩写词一样但是会有不同的解释。这里作者给大家整理了部分术语词典,后面会按照更新顺序一一分享出来。废话不多说,直接开始,如有遗漏,欢迎大家在评...
- JD.com Deepens Push Into Embodied Intelligence With Investment in Sensor Maker PaXiniTech
-
ToraOne,thesecond-generationmultidimensionaltactilehumanoidrobotdevelopedbyPaXiniTechTMTPOS...
- Hong Kong's Consumer Market Becomes New Battleground for Chinese Mainland Internet Giants
-
AI-generatedimageTMTPOST--StrollthroughthestreetsofHongKongtoday,anditmightfeellikey...
- http2解决了哪些问题_简述http2的优点
-
HTTP/2(最初称为SPDY)是HTTP协议的第二个主要版本,它在HTTP/1.1的基础上进行了重大改进,旨在解决其在性能和效率方面的诸多瓶颈。以下是HTTP/2主要解决的问题:队头阻...
- China's economy stays strong and vital amid pressure
-
Peoplevisitthe4thChina-CEECExpo&InternationalConsumerGoodsFairinNingbo,eastChina's...
- JD.com Makes $2.4 Billion Bid for Ceconomy in Bold Push to Build a Global Retail Empire
-
TMTPOST--JD.comhasunveiledplanstoacquireGermany’sCeconomyAG—theparentofEurope’sleading...
- 深入剖析 Java 中的装饰器设计模式:原理、应用与实践
-
在Java软件开发的广阔天地里,设计模式犹如璀璨星辰,照亮我们构建高效、可维护系统的道路。今天,让我们聚焦于其中一颗闪耀的星——装饰器设计模式,深入探究它的奥秘,看看如何利用它为我们的代码赋予...
- 组合模式应用-适配器模式_适配器组件
-
写在前面Hello,我是易元,这篇文章是我学习设计模式时的笔记和心得体会。如果其中有错误,欢迎大家留言指正!该部分为各模式组合使用,涉及代码较多,熟能生巧。内容回顾定义适配器模式是一种结构型设计模式,...
- OOM (Out Of Memory) 故障排查指南
-
1.确认OOM类型首先需要确认是哪种类型的OOM:JavaHeapOOM:Java堆内存不足NativeMemoryOOM:本地内存不足MetaspaceOOM:元空间内存不足Contai...
- 刷完这49题,面试官当场给Offer!Java程序员必备指南
-
1.问题:如果main方法被声明为private会怎样?答案:能正常编译,但运行的时候会提示”main方法不是public的”。2.问题:Java里的传引用和传值的区别是什么?答案:传引用是指传递的是...
- C#编程基础(看这一篇就够了)_c#编程入门与应用
-
C#及其开发环境简介C#概述C#是一个现代的、通用的、面向对象的编程语言,由微软(Microsoft)开发,经Ecma和ISO核准认可。它由AndersHejlsberg和他的团队在.NET框架开发...
- 说一下JDK的监控和 线上处理的一些case
-
一句话总结JDK监控常用工具包括JConsole、VisualVM、JMC等,用于实时查看内存、线程、GC状态。线上常见问题处理:内存泄漏通过heapdump分析对象引用链;频繁GC可调整-Xmx/...
- JavaScript深拷贝极简指南:3种方法解决嵌套与循环引用难题
-
为什么需要深拷贝?首先我们看看浅拷贝,point指向的是同一个地址,这时我们修改obj2.point的属性时,obj1的point属性也会被修改再看看深拷贝,point指向的是不同地址,这时我们修改o...
- Java 25 在 JEP 519 中集成了紧凑对象头
-
作者|ANMBazlurRahman译者|刘雅梦策划|丁晓昀Java25通过JEP519将紧凑对象头作为产品特性进行了集成,在不需要更改任何代码的情况下,为开发人员提供了...
- 每日一练 Python 面试题(1)_python每日一记
-
以下是5道Python基本语法相关的面试题,涵盖变量、运算符、数据结构、函数和异常处理等核心概念:1.变量与作用域题目:以下代码的输出是什么?解释原因。x=10deffunc():...
- 一周热门
- 最近发表
-
- 半导体行业术语缩写词典总结-JKL_半导体词汇缩写表
- JD.com Deepens Push Into Embodied Intelligence With Investment in Sensor Maker PaXiniTech
- Hong Kong's Consumer Market Becomes New Battleground for Chinese Mainland Internet Giants
- http2解决了哪些问题_简述http2的优点
- China's economy stays strong and vital amid pressure
- JD.com Makes $2.4 Billion Bid for Ceconomy in Bold Push to Build a Global Retail Empire
- 深入剖析 Java 中的装饰器设计模式:原理、应用与实践
- 组合模式应用-适配器模式_适配器组件
- OOM (Out Of Memory) 故障排查指南
- 刷完这49题,面试官当场给Offer!Java程序员必备指南
- 标签列表
-
- HTML 简介 (30)
- HTML 响应式设计 (31)
- HTML URL 编码 (32)
- HTML Web 服务器 (31)
- HTML 表单属性 (32)
- HTML 音频 (31)
- HTML5 支持 (33)
- HTML API (36)
- HTML 总结 (32)
- HTML 全局属性 (32)
- HTML 事件 (31)
- HTML 画布 (32)
- HTTP 方法 (30)
- 键盘快捷键 (30)
- CSS 语法 (35)
- CSS 轮廓宽度 (31)
- CSS 谷歌字体 (33)
- CSS 链接 (31)
- CSS 定位 (31)
- CSS 图片库 (32)
- CSS 图像精灵 (31)
- SVG 文本 (32)
- 时钟启动 (33)
- HTML 游戏 (34)
- JS Loop For (32)