首页ElasticSearch中，若使用默认分词器对中原工学院这五个字进行分词，结果为：中原工、学院、工学院吗？

ElasticSearch中，若使用默认分词器对中原工学院这五个字进行分词，结果为：中原工、学院、工学院吗？

时间: 2024-03-01 22:49:24 浏览: 61

windows版本ES7.17.3中文分词器elasticsearch-analysis-ik-7.17.3 .zip

用于elasticsearch7.17.3这个版本的ik中文分词器，考虑到官网有时网络不稳定下载不下来，这里特意上传，方便大家使用；目录结构如下： config -- 文件夹 plugin-security.policy plugin-descriptor.properties elasticsearch-analysis-ik-7.17.3.jar commons-logging-1.2.jarcommons-logging-1.2.jar commons-codec-1.9.jar httpcore-4.4.4.jar httpclient-4.5.2.jar 其中config文件夹里面的内容如下： preposition.dic stopword.dic extra_stopword.dic suffix.dic IKAnalyzer.cfg.xml surname.dic quantifier.dic extra_single_word_low_freq.dic extra_single_word.dic extra_single_word_full.dic main.dic

不完全正确。ElasticSearch中的默认分词器是Standard Analyzer，它会将中原工学院这五个字分为三个词：中原工、学院、工学院。但是如果你使用的是中文分词器，如ik_smart分词器或ik_max_word分词器，它们会将中原工学院这五个字分为一个词：中原工学院。需要注意的是，ElasticSearch中的分词器可以通过配置进行自定义，因此具体的分词结果还取决于你使用的分词器及其配置。

阅读全文