我有来自Logstash的数据,这些数据正在以过度的方式进行分析。从本质上讲,该领域"OS X 10.8"将被分解成"OS", "X"和"10.8"。我知道我可以更改现有数据的映射和重新索引,但是如何更改默认分析器(在ElasticSearch或LogStash中)以避免将来的数据出现此问题?
"OS X 10.8"
"OS"
"X"
"10.8"
具体解决方案:在我第一次将数据发送到新集群之前,我为该类型创建了一个映射。
IRC解决方案:创建索引模板
如您所知,当未明确指定分析器时,elasticsearch使用标准分析器。因此,在设置模板时,您可以设置自定义分析器,其名称为 standard 。在这里,您可以设置自己的设置分析器,令牌库,令牌过滤器的规则。
以下是一些有用的链接,可帮助您更好地理解:
http://elasticsearch-users.115913.n3.nabble.com/How-we-can-change- Elasticsearch-default-analyzer-td4040411.html
http://www.elasticsearch.org/guide/zh- CN/elasticsearch/reference/current/analysis.html