elasticsearch中ik_smart、ik_max_word 详细
时间: 2024-06-14 12:09:07 浏览: 219
elasticsearch-analysis-ik-6.7.2.zip
在Elasticsearch中,ik_smart和ik_max_word是两种常用的中文分词器,用于将中文文本进行分词处理。
1. ik_smart分词器:
ik_smart是一种智能分词器,它会尽可能地将文本切分成有意义的词语。它具有较高的准确性和较低的分词数量,适用于对文本进行精确的分析和搜索。例如,对于输入的句子"我爱中国",ik_smart会将其分为"我"、"爱"、"中国"三个词语。
2. ik_max_word分词器:
ik_max_word是一种细粒度分词器,它会将文本切分成尽可能多的词语。它具有较高的分词数量和较低的准确性,适用于对文本进行全文检索和模糊匹配。例如,对于输入的句子"我爱中国",ik_max_word会将其分为"我"、"爱"、"中国"、"爱中国"四个词语。
这两种分词器都是基于IK Analyzer开发而来,IK Analyzer是一个开源的中文分词工具。它支持细粒度和智能两种分词模式,并且可以根据用户的需求进行配置和定制。
阅读全文