Why use lucene
Lucene 作为一个全文检索引擎,其具有如下突出的优点:
( 1 )索引文件格式独立于应用平台。 Lucene 定义了一套以 8 位字节为基础的索
引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件。
( 2 )在传统全文检索引擎的倒排索引的基础上,实现了分块索引,能够针对新的
文件建立小文件索引,提升索引速度。然后通过与原有索引的合并,达到优化的目
的。
( 3 )优秀的面向对象的系统架构,使得对于 Lucene 扩展的学习难度降低,方便
扩充新功能。
( 4 )设计了独立于语言和文件格式的文本分析接口,索引器通过接受 Token 流
完成索引文件的创立,用户扩展新的语言和文件格式,只需要实现文本分析的接口。
( 5 )已经默认实现了一套强大的查询引擎,用户无需自己编写代码即使系统可获
得强大的查询能力, Lucene 的查询实现中默认实现了布尔操作、模糊查询
( Fuzzy Search )、分组查询等等。
开源 , 可扩展能力强 , 有各种语言版本 , 适合各种平台 ,
评论1