一尘不染

如何使用linux`perf`工具生成“ CPU外”配置文件

linux

Brendan D. Gregg(DTrace书的作者)有一个有趣的配置文件变体:“ Off-
CPU”配置文件
(和Off-CPU Flame
Graph
幻灯片2013,第112-137页),查看线程或应用程序被阻塞的位置(是不是由CPU执行,而是由于CPU资源不足而正在等待I
/ O,页面错误处理程序或调度的):

这段时间揭示了在关闭CPU时哪些代码路径被阻塞并等待,以及确切地等待了多长时间。这不同于传统的分析,传统的分析通常以给定的时间间隔对线程的活动进行采样,并且(通常)仅在线程正在CPU上执行工作时才检查线程。

他还可以将CPU外配置文件数据和CPU上配置文件组合在一起:http
:
//www.brendangregg.com/FlameGraphs/hotcoldflamegraphs.html

Gregg给出的示例是使用制作的dtrace,在Linux
OS中通常不可用。但是也有一些类似的工具(ktap,systemtap,perf),而perf我认为该工具具有最广泛的安装基础。通常perf生成的CPU上的配置文件(哪些功能在CPU上执行得更多)。

  • 如何将Gregg的Off-CPU示例转换perf为Linux中的分析工具?

PS:LISA13,
p124中的幻灯片中有离
CPU火焰图的systemtap变体的链接:“ Yichun
Zhang创建了这些,并已在Linux上使用它们与SystemTap来收集特性数据。请参阅:• http:// agentzh .org / misc /
slides / off-cpu-flame-graphs.pdf
”(2013年8月23日的CloudFlare啤酒会议)


阅读 295

收藏
2020-06-07

共1个答案

一尘不染

我发表的perf技术[1]是一个高开销的解决方法,直到perf对此提供BPF支持为止。

目前,在Linux上生成CPU外火焰图的成本最低的方法是在4.6+内核(具有BPF堆栈跟踪支持)上,并且具有bcc /
BPF。我为此编写了一个工具offcputime [2],该工具可以与-
f选项一起运行以用于“折叠输出”,适合于将其输入flamegraph.pl。这个offcputime工具对内核内容中的所有内容进行计时和堆栈计数,并转储报告,然后用符号打印。

我希望有一天,perf本身也将能够做到这一点:运行一个BPF程序,该程序执行内核内计数和报告转储。

同时,我们可以使用密件抄送/
BPF。如果由于某种原因不能使用bcc,则可以立即使用该offcputime程序并将其用C编写。Linux源代码中提供了一个更复杂的版本,如samples
/ bpf / offwaketime *。有了Linux上的新BPF功能,只要有意愿,就有办法。

[1] http://www.brendangregg.com/blog/2015-02-26/linux-perf-off-cpu-flame-
graph.html

[2]
https://github.com/iovisor/bcc/blob/master/tools/offcputime_example.txt

2020-06-07