一尘不染

在Linux中将制表符分隔的文件转换为CSV的最快方法

linux

我有一个制表符分隔的文件,其中包含超过2亿行。在Linux中将其转换为CSV文件的最快方法是什么?该文件的确包含多行标题信息,我需要将其删除,但是标题行数是已知的。我已经看到了有关sed和的建议gawk,但是我想知道是否存在“首选”选择。

为了澄清起见,此文件中没有嵌入的选项卡。


阅读 333

收藏
2020-06-03

共1个答案

一尘不染

如果您需要做的就是 所有制表符 转换 为逗号,tr则可能是这样。

此处的空白是文字标签:

$ echo "hello   world" | tr "\\t" ","
hello,world

当然,如果您在文件的字符串文字中嵌入了制表符,那么这也会错误地转换它们。但是嵌入的文字标签很少见。

2020-06-03