简介(什么是arthas?)

Arthas 是一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。

Arthas作用

  • 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?

  • 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?

  • 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?

  • 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!

  • 是否有一个全局视角来查看系统的运行状况?

  • 有什么办法可以监控到 JVM 的实时运行状态?

  • 怎么快速定位应用的热点,生成火焰图?

  • 怎样直接从 JVM 内查找某个类的实例?

Arthas有这么多作用,但很多情况下,我们的同学只是听说过,并没有实际使用过,甚至只是为了面试去看了下。那么这篇文章我们就先讲下arthas的基本命令,及其作用吧。

Arthas安装与退出

下载arthas-boot.jar,直达链接:下载 | arthas (aliyun.com)

通过命令进行启动

curl -O https://arthas.aliyun.com/arthas-boot.jar
java -jar arthas-boot.jar

启动之后会展示现在正在运行的java进程信息

$ $ java -jar arthas-boot.jar
* [1]: 35542
  [2]: 71560 math-game.jar

输入对应的进程编号,即可对改程序进行attach, 并输入相应日志

[INFO] Try to attach process 71560
[INFO] Attach process 71560 success.
[INFO] arthas-client connect 127.0.0.1 3658
  ,---.  ,------. ,--------.,--.  ,--.  ,---.   ,---.
 /  O  \ |  .--. ''--.  .--'|  '--'  | /  O  \ '   .-'
|  .-.  ||  '--'.'   |  |   |  .--.  ||  .-.  |`.  `-.
|  | |  ||  |\  \    |  |   |  |  |  ||  | |  |.-'    |
`--' `--'`--' '--'   `--'   `--'  `--'`--' `--'`-----'


wiki: https://arthas.aliyun.com/doc
version: 3.0.5.20181127201536
pid: 71560
time: 2018-11-28 19:16:24

$

命令列表

jvm 相关

  • dashboard - 当前系统的实时数据面板

  • getstatic - 查看类的静态属性

  • heapdump - dump java heap, 类似 jmap 命令的 heap dump 功能

  • jvm - 查看当前 JVM 的信息

  • logger - 查看和修改 logger

  • mbean - 查看 Mbean 的信息

  • memory - 查看 JVM 的内存信息

  • ognl - 执行 ognl 表达式(比如你想调用某个方法 可以直接通过表达式调用)

  • perfcounter - 查看当前 JVM 的 Perf Counter 信息

  • sysenv - 查看 JVM 的环境变量

  • sysprop - 查看和修改 JVM 的系统属性

  • thread - 查看当前 JVM 的线程堆栈信息

  • vmoption - 查看和修改 JVM 里诊断相关的 option

  • vmtool - 从 jvm 里查询对象,执行 forceGc

class/classloader 相关

  • classloader - 查看 classloader 的继承树,urls,类加载信息,使用 classloader 去 getResource

  • dump - dump 已加载类的 byte code 到特定目录

  • jad - 反编译指定已加载类的源码

  • mc - 内存编译器,内存编译.java文件为.class文件

  • redefine - 加载外部的.class文件,redefine 到 JVM 里

  • retransform - 加载外部的.class文件,retransform 到 JVM 里

  • sc - 查看 JVM 已加载的类信息

  • sm - 查看已加载类的方法信息

monitor/watch/trace 相关

注意

请注意,这些命令,都通过字节码增强技术来实现的,会在指定类的方法中插入一些切面来实现数据统计和观测,因此在线上、预发使用时,请尽量明确需要观测的类、方法以及条件,诊断结束要执行 stop 或将增强过的类执行 reset 命令。

  • monitor - 方法执行监控

  • stack - 输出当前方法被调用的调用路径

  • trace - 方法内部调用路径,并输出方法路径上的每个节点上耗时(线上接口太慢,想排查哪里耗时久了)

  • tt - 方法执行数据的时空隧道,记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测

  • watch - 方法执行数据观测。对方法进行监控,比如线上没打日志,只知道某个方法异常了,就可以对其进行监控,快速定位问题,无需再次加日志代码,重新发布定位了。

profiler/火焰图

鉴权

options

  • options - 查看或设置 Arthas 全局开关

管道

Arthas 支持使用管道对上述命令的结果进行进一步的处理,如sm java.lang.String * | grep 'index'

  • grep - 搜索满足条件的结果

  • plaintext - 将命令的结果去除 ANSI 颜色

  • wc - 按行统计输出结果

后台异步任务

当线上出现偶发的问题,比如需要 watch 某个条件,而这个条件一天可能才会出现一次时,异步后台任务就派上用场了,详情请参考这里

  • 使用 > 将结果重写向到日志文件,使用 & 指定命令是后台运行,session 断开不影响任务执行(生命周期默认为 1 天)

  • jobs - 列出所有 job

  • kill - 强制终止任务

  • fg - 将暂停的任务拉到前台执行

  • bg - 将暂停的任务放到后台执行

基础命令

  • base64 - base64 编码转换,和 linux 里的 base64 命令类似

  • cat - 打印文件内容,和 linux 里的 cat 命令类似

  • cls - 清空当前屏幕区域

  • echo - 打印参数,和 linux 里的 echo 命令类似

  • grep - 匹配查找,和 linux 里的 grep 命令类似

  • help - 查看命令帮助信息

  • history - 打印命令历史

  • keymap - Arthas 快捷键列表及自定义快捷键

  • pwd - 返回当前的工作目录,和 linux 命令类似

  • quit - 退出当前 Arthas 客户端,其他 Arthas 客户端不受影响

  • reset - 重置增强类,将被 Arthas 增强过的类全部还原,Arthas 服务端关闭时会重置所有增强过的类

  • session - 查看当前会话的信息

  • stop - 关闭 Arthas 服务端,所有 Arthas 客户端全部退出

  • tee - 复制标准输入到标准输出和指定的文件,和 linux 里的 tee 命令类似

  • version - 输出当前目标 Java 进程所加载的 Arthas 版本号

常用命令

在我们公司,开发环境是自己的机器,测试环境是容器发布。而因为很多时候开发环境的数据不全,业务方也没有开发环境给你调试。所以测试过程中开发环境很难发现问题,而测试环境要发现问题,那只能靠异常栈,但是要完整定位问题也很难。所以arthas还是很好用来排查问题的。

常用命令有

#监控方法调用耗时
trace class method 
#监控方法 其中-x表示遍历对象深度  比如一个对象里面嵌套了另一个对象 想要把值dou都打印 就需要增加深度 否则打印的是堆地址
watch class method '{params,returnObj,throwExp}' -x n  
#手动执行方法 当你知道某些方法异常了,要重现的时候,可以直接调用该方法,而不需要从接口层调用
ognl express

当然 arthas还有很多用法,具体的可以看需求自己去使用