一尘不染

git show / log,不带外壳转义序列,用于python sh

python

我正在使用python的sh编写git命令脚本。例如,我做类似的事情

import sh
git = sh.git.bake(_cwd='/some/dir/')

project_hash = git('rev-parse', 'HEAD').stdout.strip()
project_branch = git('rev-parse', '--abbrev-ref', 'HEAD').stdout.strip()
project_date = git('log', '-1', '--pretty=format:%ci').stdout.strip()

然后将project_hash,project_branch和project_date写入数据库等。

问题是git有时会在其输出中添加shell换码序列。例如,

print(repr(project_hash))
print(repr(project_branch))
print(repr(project_date))

导致

'e55595222076bd90b29e184b6ff6ad66ec8c3a03'
'master'
'\x1b[?1h\x1b=\r2012-03-26 01:07:40 -0500\x1b[m\r\n\r\x1b[K\x1b[?1l\x1b>'

前两个字符串不是问题,但最后一个字符串(日期)具有转义序列。

有什么办法可以摆脱这些问题,例如要求git不要输出任何转义序列?

我用git log命令尝试了“ –no-color”选项。那没有帮助。

我也很乐意在python本身中删除它们,但我不知道如何。我尝试了s.encode(’ascii’),其中s是日期字符串。那并没有改变。

没有外壳转义序列的Python中的标准输出解决了相同的问题。推荐使用python的子进程而不是sh。例如,我可以

project_date = subprocess.check_output(["git", "log", "-1", "--pretty=format:%ci"], cwd='/some/dir/')

print(repr(project_date))

'2012-03-26 01:07:40 -0500'

那就是我想要的。但是,如果可能的话,我宁愿坚持使用sh,因此想知道是否可以避免使用sh进行转义序列。

有什么建议?


阅读 283

收藏
2021-01-20

共1个答案

一尘不染

这些不是颜色序列,看起来像终端初始化序列。特别:

ESC [ ? 1 h ESC =

是打开功能键模式的顺序,

ESC [ ? 1 l ESC >

是再次将其关闭的顺序。这表明git log正在通过寻呼机运行。我不太清楚为什么。通常,当输出是管道时,git会抑制对分页器的使用(subprocess.Popen()至少与它一样sh,尽管我没有使用过该sh模块,但我会考虑with
)。

(暂停查阅文档…)

啊哈!根据sh sh模块文档,默认情况下,sh-module-
run命令的输出通过伪tty。这是在欺骗git运行您的寻呼机。

作为一种较脏的解决方法git --no-pager log ...,即使使用,您也可以禁止使用寻呼机sh。或者,您可以尝试使用该_tty_out=False参数(再次,我没有使用过sh模块,您将不得不进行一些实验)。有趣的是,sh模块文档底部的示例之一是git!

2021-01-20