tsv-utils (TSV Utilities) 由 eBay 开源,是一组用于操作大型表格数据文件的命令行工具,适用于机器学习、数据挖掘和类似环境中的数字及文本数据,支持过滤、抽样、统计计算等操作。tsv-utils 在使用大数据集的时候尤其有优势,它比起提供类似功能的其他工具,有着更快的速度(对比数据可查阅 2018 Comparative Benchmarks Update)。
tsv-utils 的工作方式类似于传统的 unix 命令行工具(如cut、 sort和 grep),每个工具都是一个独立的可执行文件。这些工具包括:
cut
sort
grep