.java程序如何在hadoop上运行

### 回答1： Java程序可以在Hadoop上运行，以下是一些基本步骤： 1. 确认Hadoop环境已经搭建完成并启动。 2. 将Java程序打包成Jar包。 3. 将Jar包上传到Hadoop集群上。 4. 编写一个Hadoop作业来运行Java程序，通常使用hadoop jar命令来执行这个作业，其中包括指定输入和输出路径等参数。下面是一个示例作业的代码： ``` import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.*; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper; import org.apache.hadoop.mapreduce.Reducer; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; public class WordCount { public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable>{ private final static IntWritable one = new IntWritable(1); private Text word = new Text(); public void map(Object key, Text value, Context context ) throws IOException, InterruptedException { StringTokenizer itr = new StringTokenizer(value.toString()); while (itr.hasMoreTokens()) { word.set(itr.nextToken()); context.write(word, one); } } } public static class IntSumReducer extends Reducer<Text,IntWritable,Text,IntWritable> { private IntWritable result = new IntWritable(); public void reduce(Text key, Iterable<IntWritable> values, Context context ) throws IOException, InterruptedException { int sum = 0; for (IntWritable val : values) { sum += val.get(); } result.set(sum); context.write(key, result); } } public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "word count"); job.setJarByClass(WordCount.class); job.setMapperClass(TokenizerMapper.class); job.setCombinerClass(IntSumReducer.class); job.setReducerClass(IntSumReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(IntWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 这个作业从输入文件中读取数据，将每个单词作为键并将值设置为1，最后通过reduce函数来计算每个单词出现的次数。要运行这个作业，可以使用以下命令： ``` hadoop jar WordCount.jar input output ``` 其中，WordCount.jar是打包好的Java程序，input是输入路径，output是输出路径。 ### 回答2：要在Hadoop上运行Java程序，首先需要配置好Hadoop环境。以下是运行Java程序的步骤： 1. 安装Hadoop：请按照Hadoop官方文档的指导，下载并正确安装Hadoop。 2. 编写Java程序：使用Java编程语言编写需要在Hadoop上运行的程序。确保程序适当地使用Hadoop API和类库。 3. 将Java程序打包成JAR文件：将编写的Java程序打包成JAR文件。确保JAR文件包含必要的依赖项。 4. 将输入数据上传到Hadoop文件系统（HDFS）：使用Hadoop的命令行工具或Hadoop API，将程序所需的输入数据上传到HDFS上的适当目录。 5. 配置Hadoop作业参数：在Hadoop集群的配置目录中，找到"mapred-site.xml"文件，并设置适当的作业参数。这些参数包括输入路径、输出路径、作业名称、Mapper和Reducer类等。 6. 提交Hadoop作业：使用"Hadoop jar"命令，将JAR文件和作业参数提交到Hadoop集群上运行。例如，运行以下命令： Hadoop jar YourProgram.jar your.MainClass -input inputPath -output outputPath 7. 等待作业完成：Hadoop将分配计算任务给不同的节点执行。您可以使用Hadoop的JobTracker Web界面来跟踪作业的状态和进展。 8. 获取输出结果：一旦作业完成，您可以使用Hadoop的命令行工具或Hadoop API，从HDFS获取输出结果。

阅读全文

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通

.java程序如何在hadoop上运行

大家在看

COBIT操作手册

2000-2022年 上市公司-股价崩盘风险相关数据（数据共52234个样本，包含do文件、excel数据和参考文献）.zip

IEEE_Std_1588-2008

SC1235设计应用指南_V1.2.pdf

CG2H40010F PDK文件

最新推荐

使用hadoop实现WordCount实验报告.docx

使用Eclipse编译运行MapReduce程序.doc

Android程序报错程序包org.apache.http不存在问题的解决方法

Hadoop的单机伪分布式搭建和运行第一个WordCount程序

Droste：探索Scala中的递归方案

Simulink DLL性能优化：实时系统中的高级应用技巧

rust语言将文本内容转换为音频

安卓蓝牙技术实现照明远程控制

【Simulink DLL集成】：零基础快速上手，构建高效模型策略

cent os7开启syslog外发服务脚本

2000-2022年上市公司-股价崩盘风险相关数据（数据共52234个样本，包含do文件、excel数据和参考文献）.zip