如何从一个文件找到另一个文件中的单词？

一尘不染

linux

在一个文本文件中，我有150个字。我还有另一个文本文件，大约有100,000行。

如何检查属于第一个文件的每个单词是否在第二个文件中？

我曾考虑过使用grep，但找不到如何使用它来阅读原始文本中的每个单词。

有没有办法做到这一点awk？还是其他解决方案？

我尝试使用此shell脚本，但它几乎匹配每一行：

#!/usr/bin/env sh
cat words.txt | while read line; do  
    if grep -F "$FILENAME" text.txt
    then
        echo "Se encontró $line"
    fi
done

我发现的另一种方法是：

fgrep -w -o -f "words.txt" "text.txt"

阅读 311

2020-06-03

共1个答案

一尘不染

您可以使用grep -f：

grep -Ff "first-file" "second-file"

否则匹配完整的单词：

grep -w -Ff "first-file" "second-file"

更新： 根据评论：

awk 'FNR==NR{a[$1]; next} ($1 in a){delete a[$1]; print $1}' file1 file2

2020-06-03