大数据实验三hdfs操作方法和基础编程实验的实验结果和结论

实验三：HDFS操作方法和基础编程实验 1. 实验目的了解HDFS的基本操作方法和基础编程实验，掌握Hadoop文件系统的操作。 2. 实验环境 - 操作系统：Windows 10 - 虚拟机软件：VMware Workstation 15 Pro - 虚拟机操作系统：CentOS 7 - Hadoop版本：2.7.7 3. 实验步骤 3.1 HDFS操作方法 3.1.1 启动HDFS服务在CentOS 7中打开终端，输入以下命令启动HDFS服务： ``` start-dfs.sh ``` 3.1.2 创建文件夹 HDFS中的文件夹称为目录，使用以下命令在HDFS中创建一个目录： ``` hadoop fs -mkdir /test ``` 3.1.3 上传文件使用以下命令将本地文件上传到HDFS中的目录： ``` hadoop fs -put /opt/test.txt /test ``` 3.1.4 下载文件使用以下命令将HDFS中的文件下载到本地： ``` hadoop fs -get /test/test.txt /opt ``` 3.1.5 查看文件使用以下命令查看HDFS中的文件： ``` hadoop fs -ls /test ``` 3.1.6 删除文件使用以下命令删除HDFS中的文件： ``` hadoop fs -rm /test/test.txt ``` 3.2 基础编程实验 3.2.1 实验要求编程实现一个完整的Hadoop MapReduce程序，实现词频统计功能。 3.2.2 实验步骤 3.2.2.1 编写Mapper类在Eclipse中新建一个Java项目，创建Mapper类，代码如下： ``` public class WordCountMapper extends Mapper<LongWritable, Text, Text, IntWritable> { private final static IntWritable one = new IntWritable(1); private Text word = new Text(); public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { String line = value.toString(); StringTokenizer tokenizer = new StringTokenizer(line); while (tokenizer.hasMoreTokens()) { word.set(tokenizer.nextToken()); context.write(word, one); } } } ``` 3.2.2.2 编写Reducer类创建Reducer类，代码如下： ``` public class WordCountReducer extends Reducer<Text, IntWritable, Text, IntWritable> { private IntWritable result = new IntWritable(); public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException { int sum = 0; for (IntWritable val : values) { sum += val.get(); } result.set(sum); context.write(key, result); } } ``` 3.2.2.3 编写Driver类创建Driver类，代码如下： ``` public class WordCount { public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "word count"); job.setJarByClass(WordCount.class); job.setMapperClass(WordCountMapper.class); job.setCombinerClass(WordCountReducer.class); job.setReducerClass(WordCountReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(IntWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 3.2.2.4 打包右键项目，选择Export，选择JAR file，点击Next，选择要导出的项目和要导出的类，点击Next，选择要导出的JAR文件路径和文件名，点击Finish，即可生成JAR文件。 3.2.2.5 运行使用以下命令在Hadoop集群上运行程序： ``` hadoop jar /opt/wordcount.jar WordCount /input /output ``` 其中，/input是输入文件所在的目录，/output是输出文件所在的目录。 4. 实验结果与结论经过以上步骤，我们可以成功地完成HDFS操作方法和基础编程实验，从而掌握了Hadoop文件系统的操作。同时，我们还通过编写MapReduce程序实现了词频统计功能，进一步加深了对Hadoop的理解和应用。

阅读全文

大数据实验三hdfs操作方法和基础编程实验的实验结果和结论

相关推荐

华中科技大学大数据导论课程设计实验资料包

熟悉HDFS操作与Java API：实验二报告

掌握Spark编程：从基础到实战操作实验

大数据实验二-HDFS编程实践

全套大数据基础学习教程，包含最基础的centos、maven 大数据主要包含hdfs、mr、yarn、hbase、kafka、scala、sparkcore、sparkstreaming、sp.zip

HadoopLearning：完整的大数据基础学习教程，包含最基础的centos，maven。大数据主要包含hdfs，mr，yarn，hbase，kafka，scala，sparkcore，sparkstreaming，sparksql。

大数据实验 实验三：熟悉常用的HBase操作

大数据技术基础实验报告-调用Java API实现HDFS操作.doc

大数据基础编程、实验和案例教程

大数据实验四-MapReduce编程实践

大数据基础编程、实验和案例教程.rar

《Hadoop大数据技术与应用》-HDFS常用方法和MapReduce程序.docx

大数据实验报告.docx

大数据技术基础实验报告-MapReduce编程 (2).docx

大数据实验Hbase安装部署和使用javaapi调用.pdf

软件学院大数据实验汇总实验1-5（截图无学号水印）

太原理工大学《大数据实验》

实验2 熟悉常用的HDFS操作

data_大数据实验四1_源码

林子雨大数据编程课程实验答案

大家在看

电法正反演方法和软件使用介绍(“反演”文档)共33张.pptx

IBM DS4700磁盘阵列安装配置指南

Spi_int.rar_dsp spi初始化_spi dsp

海思芯片规格对比.pdf

中南大学943数据结构1997-2020真题&解析

最新推荐

大数据实验Hbase安装部署和使用javaapi调用.pdf

spark企业级大数据项目实战.docx

最新的大数据高新就业视频（全）

使用Eclipse编译运行MapReduce程序.doc

【机器人】将ChatGPT飞书机器人钉钉机器人企业微信机器人公众号部署到vercel及docker_pgj.zip

Python调试器vardbg：动画可视化算法流程

管理建模和仿真的文件

【IT设备维保管理入门指南】：如何制定有效的维护计划，提升设备性能与寿命

python爬取网页链接，url = “https://koubei.16888.com/57233/0-0-0-0”

掌握Web开发：Udacity天气日记项目解析

大数据实验实验三：熟悉常用的HBase操作