读取 ikAnalyzer.cfg.xml 源码
时间: 2024-06-08 18:07:12 浏览: 127
以下是 ikAnalyzer.cfg.xml 的源码:
```xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">custom/ext_stopword.dic</entry>
<!--用户可以在这里配置远程扩展字典,下载后缓存在本地-->
<entry key="remote_ext_dict">http://xxx.com/mydict.dic;http://xxx.com/single_word_low_freq.dic</entry>
<!--用户可以在这里配置远程扩展停止词字典,下载后缓存在本地-->
<entry key="remote_ext_stopwords">http://xxx.com/ext_stopword.dic</entry>
<!--插件式分词器名称-->
<entry key="plugins">com.example.ext.MyPluginAnalyzer</entry>
<!--配置内置字典-->
<entry key="use_smart">false</entry>
</properties>
```
该文件为 IK Analyzer 的配置文件,其中包含了以下配置项:
- ext_dict:用户自定义的扩展词典路径,可以配置多个路径,用分号隔开;
- ext_stopwords:用户自定义的扩展停用词典路径;
- remote_ext_dict:远程扩展词典的 URL,可以配置多个 URL,用分号隔开;
- remote_ext_stopwords:远程扩展停用词典的 URL;
- plugins:插件式分词器的类名;
- use_smart:是否使用智能分词模式,默认为 false。
以上就是 ikAnalyzer.cfg.xml 的源码。
阅读全文