Python nltk.tokenize模块,常用函数和类
下面列出了Python nltk.tokenize 模块中定义的常用函数和类,我们从259个开源Python项目中,按照使用频率进行了排序。
函数和类 | 使用项目数 |
---|---|
1. word_tokenize() | 用在(128)个项目中 |
2. sent_tokenize() | 用在(61)个项目中 |
3. RegexpTokenizer() | 用在(50)个项目中 |
4. TweetTokenizer() | 用在(35)个项目中 |
5. wordpunct_tokenize() | 用在(30)个项目中 |
6. WordPunctTokenizer() | 用在(17)个项目中 |
7. WhitespaceTokenizer() | 用在(13)个项目中 |
8. TreebankWordTokenizer() | 用在(13)个项目中 |
9. line_tokenize() | 用在(8)个项目中 |