Java诊断神器:6到飞起的Arthas,这些功能赶紧安排一下!

1.简介

什么是 Arthas?

摘录一段官方 Github 上的简介

Java诊断神器:6到飞起的Arthas,这些功能赶紧安排一下!

阿里巴巴Arthas是一种诊断工具,使我们能够监视,分析和诊断Java应用程序。使用Arthas的主要好处之一是,我们不需要更改代码,甚至不需要重新启动要监视的Java服务。

在本文中,我们将先安装Arthas,然后再进行案例研究以演示Arthas的一些关键功能。

最后,由于Arthas是用Java编写的,因此它是跨平台的,可以在Linux,macOS和Windows上正常地运行。

2.下载和入门

首先,让我们开始直接通过下载链接或使用curl下载Arthas库:

curl -O https://alibaba.github.io/arthas/arthas-boot.jar

现在,让我们通过-h(帮助)选项运行Arthas来测试其是否正常工作:

java -jar arthas-boot.jar -h

如果成功,我们应该看到所有显示命令的帮助指南:

Java诊断神器:6到飞起的Arthas,这些功能赶紧安排一下!

扫描二维码关注公众号,回复: 11812977 查看本文章

3.个案研究

在整个教程中,我们将使用一个非常简单的应用程序,该应用程序基于使用递归的Fibonacci序列的效率相当低的实现:

public class FibonacciGenerator {
     public static void main(String[] args) {
        System.out.println("Press a key to continue");
        System.in.read();
        for (int i = 0; i < 100; i++) {
            long result = fibonacci(i);
            System.out.println(format("fib(%d): %d", i, result));
        }    }     public static long fibonacci(int n) {
        if (n == 0 || n == 1) {
            return 1L;
        } else {
            return fibonacci(n - 1) + fibonacci(n - 2);
        }    }}

这个例子中最有趣的部分是斐波那契遵循斐波那契数的数学定义方法。

在主要方法中,我们使用带有较大数字的for循环,因此我们的计算机将忙于较长的计算。

4.开始Arthas

现在,让我们尝试一下Arthas!我们需要做的第一件事是运行我们的小型Fibonacci应用程序。为此,我们可以使用我们喜欢的IDE或直接在终端中运行它。它将要求按一个键才能开始,将过程附加到Arthas后,我们将按任意键。

现在,让我们运行Arthas可执行文件:

java -jar arthas-boot.jar

Arthas会提示一个菜单,以选择我们要附加到的进程:

[INFO] arthas-boot version: 3.1.7
[INFO] Found existing java process, please choose one and hit RETURN.
* [1]: 25500 com.baeldung.arthas.FibonacciGenerator
...

让我们选择一个名称为com.baeldung.arthas.FibonacciGenerator的名称。只需在列表中输入数字,在此示例中为“ 1”,然后按Enter。

Arthas现在将遵循这一过程并开始:

INFO] Try to attach process 25500
[INFO] Attach process 25500 success.
...                    

一旦我们启动了Arthas,我们将提示您可以发出不同的命令。

我们可以使用help命令来获取有关可用选项的更多信息。此外,为了方便使用Arthas,我们还可以使用Tab键自动完成其命令。

将Arthas附加到我们的流程之后,现在我们可以按一个键,程序开始打印斐波那契数字。

5.仪表板

一旦启动Arthas,我们就可以使用仪表板。在这种情况下,我们通过键入dashboard命令继续。现在,我们看到一个包含几个窗格的详细屏幕以及有关Java流程的许多信息:

Java诊断神器:6到飞起的Arthas,这些功能赶紧安排一下!

更详细地了解其中一些:

  1. 顶部专用于当前正在运行的线程
  2. 重要列之一是每个线程的CPU消耗
  3. 第3节显示每个线程的CPU时间
  4. 另一个有趣的窗格是用于内存分析。列出了不同的内存区域及其统计信息。在右侧,我们有有关垃圾收集器的信息
  5. 最后,在第5节中,我们提供了有关主机平台和JVM的信息。

可以通过按q退出仪表板

应该记住,即使我们退出,Arthas也将依附于这个的流程。因此,为了使其与我们的过程正确断开链接,我们需要运行stop命令

6.分析堆栈跟踪

在仪表板中,我们看到我们的主进程几乎占用了100%的CPU。该进程的ID为1,我们可以在第一列中看到它。

现在我们已经退出了仪表板,我们可以通过运行thread命令来更详细地分析流程:

thread 1

作为参数传递的数字是线程ID。毫不奇怪,Arthas会打印出堆栈迹线,这对fibonacci方法的调用很混乱。

如果堆栈跟踪很长且很繁琐,那么thread命令允许我们使用管道:

thread 1 | grep 'main('

这只会打印与grep 命令匹配的行 :

[arthas@25500]$ thread 1 | grep 'main('
    at com.baeldung.arthas.FibonacciGenerator.main(FibonacciGenerator.java:10)

7.反编译Java类

想象一下一个场景,在这种情况下,我们正在分析一个我们了解甚少或一无所知的Java应用程序,然后突然发现堆栈中堆满了以下类型的重复调用:

[arthas@59816]$ thread 1
"main" Id=1 RUNNABLE
  at app//com.baeldung.arthas.FibonacciGenerator.fibonacci(FibonacciGenerator.java:18)
  at app//com.baeldung.arthas.FibonacciGenerator.fibonacci(FibonacciGenerator.java:18)
  ...

由于我们正在运行Arthas,因此我们可以反编译一个类以查看其内容。为此,我们可以使用jad命令,将合格的类名作为参数传递:

jad com.baeldung.arthas.FibonacciGenerator
 ClassLoader:+-jdk.internal.loader.ClassLoaders$AppClassLoader@799f7e29
  +-jdk.internal.loader.ClassLoaders$PlatformClassLoader@60f1dd34
 Location:/home/amoreno/work/baeldung/tutorials/libraries-3/target/
/*
 * Decompiled with CFR.
 */
package com.baeldung.arthas;
 import java.io.IOException;
import java.io.InputStream;
import java.io.PrintStream;
 public class FibonacciGenerator {
    public static void main(String[] arrstring) throws IOException {
   
   

输出是反编译的Java类和一些有用的元数据,例如该类的位置。这是一个非常有用和强大的功能。

8.搜索类别和搜索方法

搜索类命令在搜索JVM中加载的类时非常有用。我们可以通过键入sc并传递带有或不带有通配符的模式作为参数来使用它

[arthas@70099]$ sc *Fibonacci*
com.baeldung.arthas.FibonacciGeneratorAffect(row-cnt:1) cost in 5 ms.

一旦有了该类的合格名称,便可以使用两个附加标志来查找更多信息:

  • -d显示类的详细信息
  • -f显示类的字段

但是,必须与详细信息一起查询类的字段:

[arthas@70099]$ sc -df com.baeldung.arthas.FibonacciGenerator
  class-info        com.baeldung.arthas.FibonacciGenerator
  ...

同样,我们可以使用命令sm(搜索方法)在类中查找已加载的方法。在这种情况下,对于我们的类com.baeldung.arthas.FibonacciGenerator,我们可以运行:

[arthas@70099]$ sm com.baeldung.arthas.FibonacciGenerator
com.baeldung.arthas.FibonacciGenerator <init>()V
com.baeldung.arthas.FibonacciGenerator main([Ljava/lang/String;)Vcom.baeldung.arthas.FibonacciGenerator fibonacci(I)JAffect(row-cnt:3) cost in 4 ms.

我们也可以使用标志-d来检索方法的详细信息。最后,我们可以为方法名称传递一个可选参数,以缩小返回方法的数量:

sm -d com.baeldung.arthas.FibonacciGenerator fibonacci
 declaring-class  com.baeldung.arthas.FibonacciGenerator
 method-name      fibonacci
 modifier         public,static
 annotation
 parameters       int
 return           long
 exceptions
 classLoaderHash  799f7e29

9.监视方法调用

我们可以用Arthas做的另一很酷的事情是监视方法。在调试应用程序中的性能问题时,这可能非常方便。为此,我们可以使用monitor命令

的监视器命令需要一个标志-c <秒>和两个参数-的合格的类名称和方法名。

对于我们的案例研究,现在让我们调用monitor:

monitor -c 10 com.baeldung.arthas.FibonacciGenerator fibonacci

如预期的那样,Arthas将每10秒打印一次有关fibonacci方法的指标:

Affect(class-cnt:1 , method-cnt:1) cost in 47 ms.
 timestamp            class                                          method     total   success  fail  avg-rt(ms)  fail-rate                                                                      
-----------------------------------------------------------------------------------------------------------------------------                                                                     
 2020-03-07 11:43:26  com.baeldung.arthas.FibonacciGenerator  fibonacci  528957  528957   0     0.07        0.00%
...                                                                          

对于那些最终失败的调用,我们也有指标-这些对于调试非常有用。

10.监视方法参数

如果需要调试方法的参数,可以使用watch命令。但是,语法有点复杂:

watch com.baeldung.arthas.FibonacciGenerator fibonacci '{params[0], returnObj}' 'params[0]>10' -n 10

让我们详细了解每个参数:

  • 第一个参数是类名
  • 第二个是方法名称
  • 第三个参数是OGNL表达式,用于定义我们要观看的内容-在这种情况下,它是第一个(也是唯一的)方法参数,并返回值
  • 第四个也是最后一个可选参数是一个布尔表达式,用于过滤我们要监视的调用

对于此示例,我们只想监视大于10的参数。最后,我们添加一个标志以将结果数限制为10:

watch com.baeldung.arthas.FibonacciGenerator fibonacci '{params[0], returnObj}' 'params[0]>10' -n 10
Press Q or Ctrl+C to abort.Affect(class-cnt:1 , method-cnt:1) cost in 19 ms.
ts=2020-02-17 21:48:08; [cost=30.165211ms] result=@ArrayList[
    @Integer[11],
    @Long[144],
]
ts=2020-02-17 21:48:08; [cost=50.405506ms] result=@ArrayList[
    @Integer[12],
    @Long[233],
]
...

在这里,我们可以看到带有CPU时间和输入/返回值的调用示例。

11.探查器

通过profiler命令可以为那些对应用程序性能感兴趣的人提供非常直观的功能。探查器将评估我们的进程正在使用的CPU的性能。

让我们通过启动profiler start来运行profiler。这是一项非阻塞性任务,这意味着我们可以在探查器工作时继续使用Arthas。

在任何时候,我们可以通过运行profiler getSamples来询问探查器有多少个样本。

现在让我们使用事件探查器stop停止事件探查器。此时,将保存FlameGraph图像。在这种情况下,我们有一个图表,其中斐波那契线占主导地位。

Java诊断神器:6到飞起的Arthas,这些功能赶紧安排一下!

请注意,当我们要检测CPU时间花费在哪里时,此图表可能特别有用。

12.结论

在本文中,我们探索了Arthas的一些最强大和有用的功能。

如我们所见,Arthas有许多命令可以帮助我们诊断各种问题。当我们无法仔细检查访问应用程序的代码时,或者想要对运行在服务器上的有问题的应用程序进行快速诊断时,它也特别有用。
源代码可在Github上获取。

猜你喜欢

转载自blog.csdn.net/python8989/article/details/108468263