一尘不染

从ElasticSearch文档中检索分析的令牌

elasticsearch

尝试访问我的ElasticSearch文档中的分析/标记化的文本。

我知道您可以使用Analyze API根据您的分析模块来分析任意文本。因此,我可以将文档中的数据复制并粘贴到Analyze
API中,以查看如何对它们进行标记。

但是,这似乎不必要地耗时。有什么方法可以指示ElasticSearch在搜索结果中返回标记化文本?我已经浏览了文档,却没有发现任何东西。


阅读 291

收藏
2020-06-22

共1个答案

一尘不染

看看另一个答案:elasticsearch-返回字段的标记。不幸的是,它要求使用提供的脚本动态地重新分析字段的内容。
应该可以编写一个插件来公开此功能。这个想法是将两个端点添加到:

  • 允许读了Lucene TermsEnum像Solr的TermsComponent确实,使自动建议太有用了。请注意,它不是每个文档,而是索引中的每个术语都带有术语频率和文档频率(使用许多唯一术语可能很昂贵)
  • 允许读取术语向量(如果启用),如solrTermVectorComponent一样。这是针对每个文档的,但需要存储术语向量(您可以在映射中对其进行配置),并且还允许检索位置和偏移(如果启用)。
2020-06-22