关于 lucene 建立数据库索引的心得
关于 lucene 建立数据库索引的心得体会:
鄙人初学 lucene,而且在学习的过程中走了许多的弯路,幸亏和同事的商讨以
及他们的帮助下,学习到了很多的东西,最终也把问题得到了解决。
发表个人拙见,若有不对之处,虚心接受批评和指正。
一、 尽管现在网上关于搜索引擎开发的资料等很多,但是参吃不齐,而且很
多人都是不断的从别人那转载,然后不经过修改就放上去,也没去看过,其实
有些是有问题的,而且现在版本更新这么快,有些东西是不能通用的,比如说
Hits 的用法,所以,大家要注意有效利用;
二、 在建立索引的过程中,其实方法不一定都相同,原理基本是一样的,可
以根据自己的理解建立方法,进行查询,本来现在的搜索问题都是日新月异,
就是 lucene 的版本一样,只要有不同,就可能得到了升级,所以不一定要去
参考别人的方法,如果自己有方法可以自己根据自己的思路写,只是有的时候
可能会遇到很多麻烦,但只要坚持原理一致,也是能调试成功的;
三、 我在建立索引和搜索的过程中就遇到了很多麻烦,我建立了好几个不同
的索引,根据自己的理解,都建立成功了,但可能由于有些细节没有理解,结
果还是没能实现界面化,当然,我只选取了其中两个进行界面化了;
四、 在界面化的过程中,也遇到了争议,有人说要用 bean,有人说直接写
在 jsp 页面中调用,最后我采用了数据库查询的方式,也用在索引查询中,最
后得到了正确的结果;
五、 当 然 , 关 于 显 示 记 录 , 网 上 众 多 用 的 都 是 Document
document=searcher.doc(i);
六、 当然,我也不知道正确与否,但至少我用这个调试得到的记录是错误的,
而且就因为这个问题,我纠结了好久,最终还是得到靖毅同志的点拨后,才成
功解决。用 Document doc=searcher.doc(hits[i].doc);。
七、 也许网上是正确的,只是我可能还没能正确运用吧。
五、关于高亮显示的问题,大同小异,不会的朋友看一下网上的参考,都是能
解决的。
六、鄙人拙见,由于学习这个比较晚,所以还在不断进步中。欢迎大家批评和
交流。
七、有什么问题或者意见或者好的建议,或者有什么交流,可以通过邮箱:
766003546@qq.com 联系到鄙人。
备注:再次特别感谢靖毅同志,苗香同志以及对此有帮助的相关同志的感谢。
附件:关于高亮显示等相关问题的解决方案。
关于 IKAnalyzer3.2.8 扩展词典配置的个人心得和意见,希望对大家有参考价
值:
1.首先,要看一下 XML 的配置是否正确,一般我们不要修改的情况下就使用它
给我们的 mydict 和 ext_stopword;前者是放你需要用的个人词汇,后者是
停止词,不需要检索出来的;
2.其次,这两个一定要是 UTF-8 格式的文本,gbk 等的编码它可能不识别,因
为格式要求:<?xml version="1.0" encoding="UTF-8"?>;很明确的给出
来了;
评论8