一尘不染

使用Python分割ps的输出

linux

在Linux上,命令ps aux输出每个统计信息具有多个列的进程列表。例如

USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
...
postfix  22611  0.0  0.2  54136  2544 ?        S    15:26   0:00 pickup -l -t fifo -u
apache   22920  0.0  1.5 198340 16588 ?        S    09:58   0:05 /usr/sbin/httpd

我希望能够使用Python进行阅读,然后将每一行然后每一列分开,以便可以将它们用作值。

在大多数情况下,这不是问题:

ps = subprocess.Popen(['ps', 'aux'], stdout=subprocess.PIPE).communicate()[0]
processes = ps.split('\n')

我现在可以遍历流程以获取每一行并将其按空格分开,例如

sep = re.compile('[\s]+')
for row in processes:
    print sep.split(row)

但是,问题在于命令的最后一列有时在其中有空格。在上面的示例中,可以在命令中看到

pickup -l -t fifo -u

将被拆分为

['postfix', '22611', '0.0', '0.2', '54136', '2544', '?', 'S', '15:26', '0:00', 'pickup', '-l', '-t', 'fifo', '-u']

但我真的希望它是:

['postfix', '22611', '0.0', '0.2', '54136', '2544', '?', 'S', '15:26', '0:00', 'pickup -l -t fifo -u']

所以我的问题是,我该如何拆分列,但是当涉及到命令列时,将整个字符串保留为一个列表元素,而不是按空格拆分?


阅读 637

收藏
2020-06-02

共1个答案

一尘不染

使用第二个参数split指定将字符串拆分为的最大字段数。我想您可以通过计算第一行中的字段数(即列标题)来找到数字。

ps = subprocess.Popen(['ps', 'aux'], stdout=subprocess.PIPE).communicate()[0]
processes = ps.split('\n')
# this specifies the number of splits, so the splitted lines
# will have (nfields+1) elements
nfields = len(processes[0].split()) - 1
for row in processes[1:]:
    print row.split(None, nfields)
2020-06-02