top命令详析及排查问题使用演示

 1. top基本使用

top命令运行图

第一行:基本信息

第二行:任务信息

第三行:CPU使用情况

第四行:物理内存使用情况

buff/cache:

buffers 和 cache 都是内存中存放的数据,不同的是,buffers 存放的是准备写入磁盘的数据,而 cache 存放的是从磁盘中读取的数据 

在Linux系统中,有一个守护进程(daemon)会定期把buffers中的数据写入的磁盘,也可以使用 sync 命令手动把buffers中的数据写入磁盘。使用buffers可以把分散的 I/O 操作集中起来,减少了磁盘寻道的时间和磁盘碎片。 
cache是Linux把读取频率高的数据,放到内存中,减少I/O。Linux中cache没有固定大小,根据使用情况自动增加或删除。

第五行:交换区使用情况

Swap(内存交换区):

是硬盘上的一块空间。在内存不足的情况下,操作系统把内存中不用的数据存到硬盘的交换区,腾出内存来让别的程序运行。因此,开启swap会一定程度的引起 I/O 性能下降(阿里服务器默认不开)。

第六行:进程详细信息

 2. 问题排查模拟

介绍一下使用到的top参数

线上的出现需要使用top排查的情况一般是死循环或者死锁,下面通过代码来模拟两种情况

package com.zang.top.controller;

import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

import java.util.concurrent.TimeUnit;

/**
 * @author zangjf
 * @version zangjf: TopController.java,v1.0 2019/2/27 22:51 zangjf Exp $$
 * @since 1.0
 */
@RestController
@RequestMapping("top")
public class TopController {

    private Object lock1 = new Object();
    private Object lock2 = new Object();

    @RequestMapping("test")
    public String test() {
        return "success";
    }

    // 死循环
    @RequestMapping("loop")
    public String loop() {
        System.out.println("start");
        while (true) {}
    }

    // 死锁
    @RequestMapping("deadlock")
    public String deadlock() {
        new Thread(() -> {
            synchronized (lock1) {
                try{
                    TimeUnit.SECONDS.sleep(1);
                } catch (Exception e) {}
                synchronized (lock2) {
                    System.out.println("thread1 over");
                }
            }
        }).start();
        new Thread(() -> {
            synchronized (lock2) {
                try{
                    TimeUnit.SECONDS.sleep(1);
                } catch (Exception e) {}
                synchronized (lock1) {
                    System.out.println("thread2 over");
                }
            }
        }).start();
        return "success";
    }
}

放到服务器上启动

2.1 死循环

手动制造CPU飙高的场景,重复执行该命令三次,模拟三个导致高cpu占用的线程

curl localhost:8080/top/loop

执行top命令,可以看到pid为22095的进程CPU占用较高

 查看pid为22095的进程中线程的具体情况

top -p 22095 -H

可以看到PID为22114,22115和22116的线程占用CPU较高。这里可能有人有疑惑,为什么线程也有PID啊?其实线程进程都会有自己的ID,这个ID就叫做PID,PID是不特指进程ID,线程ID也可以叫做PID。

jstack命令工具可以得到线程堆栈信息,根据这些线程堆栈信息,我们可以去检查Java程序出现的问题。

打印PID为22095的进程的详细堆栈信息。

jstack 22095 > loop.txt

以PID为22114的线程为例,到loop.txt中查找该线程的信息,因为jstack中PID用的是16进制,所以需要将10进制的PID转换为16进制的数值到文件中查找。

printf "%x" 22114
# 输出5662

 

可以定位到程序中出现问题的代码位置

 

2.2 死锁

模拟死锁

curl localhost:8080/top/deadlock

输出堆栈信息

jstack 22223 > deadlock.txt

查看文件最后的信息,看到发现一个死锁及产生位置

参考:https://mp.weixin.qq.com/s/G7F25H3h7WuqiUdU_ocbhA

猜你喜欢

转载自www.cnblogs.com/zjfjava/p/10448002.html
今日推荐