java OOM问题排查

在做服务器端开发的时候,经常会遇到服务由于内存溢出挂掉的情况,这种情况的发生一般来说是很难预期的,也比较难以重现,对于这种问题,一般可以通过记录内存溢出时候的堆信息来排查。


1、首先可以查看服务器运行日志以及项目记录的日志,捕捉到内存溢出异常。


2、如果程序挂掉了,但是没有找到任何这个操作的日志记录。这时查看一下/var/log/messages文件。messages 日志是核心系统日志文件。它包含了系统启动时的引导消息,以及系统运行时的其他状态消息。在messages里会出现以下信息:

图1

造成这种情况的原因是因为,服务器以及项目日志都只能记录JVM内发生的内存溢出,也就是说heap(堆)的大小超出了JVM设置的大小。然而如果JVM设置的堆大小超出了操作系统允许的内存大小,那么操作系统会直接杀死进程,这种情况JVM就无法记录本次操作。

从图1中可以看出操作系统由于内存使用率过高,直接杀死了评分最高的进程,这里是java进程。Linux对于每个进程有一个OOM评分,这个评分在/proc/pid/oom_score文件中。例如/proc/8398/oom_score,如果不希望杀死这个进程,就将oom_adj内容改为-17。


3、在这种情况下首先需要调整JVM的heap大小,在运行参数中设置

 -Xms20m -Xmx20m 

将heap变小,使得JVM的OOM优先于操作系统的OOM出现。接着设置运行参数,在发生OOM的时候输出heapdump文件。

-XX:+HeapDumpOnOutOfMemoryError

-XX:HeapDumpPath=/home/admin/logs/java.hprof


4、捕获到OOM异常的时候就会生成一个java.hprof文件。


文章摘选自:http://blog.csdn.net/u010256841/article/details/41121755

猜你喜欢

转载自blog.csdn.net/qq_27376871/article/details/79169471