solr分词器IKTokenizerFactory类型导致高亮异常 Token guangz exceeds length of provided text sized 5怎么解决
时间: 2024-03-05 13:52:15 浏览: 18
这个异常的原因是在使用 Solr 进行搜索时,高亮组件需要根据查询结果进行高亮标记,但是由于使用了 IKTokenizerFactory 分词器,导致分词结果与查询结果不一致,从而出现了这个异常。
解决方法是在 Solr 的配置文件 schema.xml 中对该 Field 域进行配置,指定使用的分词器。
具体步骤如下:
1. 打开 schema.xml 文件,找到需要使用 IKTokenizerFactory 分词器的 Field 域。
2. 在 Field 域中添加以下配置:
```xml
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true"/>
</analyzer>
</fieldType>
```
3. 将 Field 域的 type 属性设置为 "text_ik",即使用上面定义的 FieldType。
4. 重新启动 Solr,重新建立索引。
这样就可以解决高亮异常 Token guangz exceeds length of provided text sized 5 的问题了。