在Linux Eclipse中编译和运行Nutch-1.0源代码指南

需积分: 10 24 下载量 85 浏览量 更新于2024-10-31 收藏 1.45MB PDF 举报
"Eclipse中编译Nutch-1.0是关于在Linux环境下使用Eclipse IDE编译和运行开源搜索引擎项目Nutch的1.0版本。这个过程涉及到确保Eclipse配置正确,下载Nutch源代码,以及解决因授权问题产生的编译错误。通过在Eclipse中创建一个新的Java Project,并从现有源代码导入Nutch-1.0目录,然后添加必要的类库和设置输出路径,可以成功导入项目。然而,由于Nutch-1.0中缺少两个插件的jar包,需要从特定网址下载并手动添加到对应插件的lib目录,以消除编译错误。" 在编译Nutch-1.0的过程中,首先确保Eclipse使用的是JDK和JRE版本1.6或更高。这是因为在Nutch的开发过程中,可能需要特定版本的Java环境支持。接下来,从Apache的官方网站下载Nutch-1.0的源代码包,并进行解压缩。 在Eclipse中,创建一个新的Java Project,并命名为"Nutch"。在创建过程中,选择"Create project from existing source"选项,并导航到解压后的Nutch-1.0目录。在项目属性设置中,确保在"Libraries"部分添加了"conf"目录,以便包含Nutch所需的配置文件。同时,在"Order and Export"中将"conf"移动到最上方,确保编译时能正确引用这些配置。 进一步,修改"Source"的输出文件夹为"Nutch/bin/zkl_build",这样编译生成的类文件将被放置在这个指定的目录下。完成这些设置后,Eclipse会自动尝试编译项目,但可能会遇到30个错误,这些错误是由于Nutch中两个插件(parse-mp3和parse-rtf)的依赖jar包缺失导致的。 为了消除这些错误,需要单独下载这两个jar包。分别访问给定的网址,下载jid3lib-0.5.1.jar和rtf-parser.jar。下载完成后,将jid3lib-0.5.1.jar复制到nutch-1.0/src/plugin/parse-mp3/lib目录,将rtf-parser.jar复制到nutch-1.0/src/plugin/parse-rtf/lib目录。执行这些操作后,刷新Eclipse项目,编译错误应该会得到解决。 最后,重新编译Nutch项目,如果所有步骤都按照描述正确执行,那么Nutch-1.0应该可以在Eclipse环境中成功编译并通过。这使得开发者可以进一步对源代码进行调试、修改和测试,以适应他们的具体需求或研究目的。对于那些对Nutch搜索引擎或者使用Eclipse进行Java项目开发感兴趣的人来说,这是一个重要的学习资源。