编程实现一个类"MyFSDataInputStream”，该类继承"org.apache.hadoop.fs.FSDataInputStream”，要求如下。 (1)实现按行读取HDFS中指定文件的方法"readLine()”，如果读到文件末尾，则返回空，否则返回文件一行的文本。 (2)实现缓存功能，即利用"MyFSDataInputStream”读取若干字节数据时，首先查找缓，如果缓存中有所需数据,则直接由缓存提供,否则从 HDFS 中读取数据。 3.查看Java帮助手册或其他资料,用"java.net.URL"和"org.apache.hadoop.fs.FsURLStreamHandlerFactory”编程来输出 HDFS 中指定文件的文本到终端中。

时间: 2024-01-22 13:19:13 浏览: 275

以下是实现MyFSDataInputStream的代码： ```java import java.io.IOException; import java.io.InputStreamReader; import java.util.LinkedList; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; public class MyFSDataInputStream extends FSDataInputStream { private static final int DEFAULT_BUFFER_SIZE = 1024; private byte[] buffer; private int bufferPos; private int bufferSize; private InputStreamReader reader; private LinkedList<String> lines; public MyFSDataInputStream(FileSystem fs, Path file) throws IOException { super(fs.open(file)); buffer = new byte[DEFAULT_BUFFER_SIZE]; bufferPos = 0; bufferSize = 0; reader = new InputStreamReader(this); lines = new LinkedList<>(); } public String readLine() throws IOException { if (lines.isEmpty()) { String line = null; int b = -1; while ((b = read()) != -1) { char c = (char) b; if (c == '\n') { if (line == null) { return ""; } else { lines.add(line); return line; } } else { if (line == null) { line = ""; } line += c; } } if (line == null) { return null; } else { lines.add(line); return line; } } else { return lines.removeFirst(); } } @Override public synchronized int read() throws IOException { if (bufferPos >= bufferSize) { bufferSize = super.read(buffer); bufferPos = 0; } if (bufferSize == -1) { return -1; } else { return buffer[bufferPos++]; } } } ``` 以下是使用MyFSDataInputStream实现从HDFS中读取文件并输出到终端的代码： ```java import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.URL; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import org.apache.hadoop.fs.FsUrlStreamHandlerFactory; public class HDFSFileReader { public static void main(String[] args) throws Exception { String hdfsFile = "hdfs://localhost:9000/user/hadoop/test.txt"; URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory()); URL url = new URL(hdfsFile); Configuration conf = new Configuration(); FileSystem fs = FileSystem.get(url.toURI(), conf); Path path = new Path(url.getPath()); MyFSDataInputStream in = new MyFSDataInputStream(fs, path); BufferedReader reader = new BufferedReader(in); String line = null; while ((line = reader.readLine()) != null) { System.out.println(line); } reader.close(); in.close(); fs.close(); } } ``` 在以上代码中，我们首先使用`URL.setURLStreamHandlerFactory()`方法将`FsURLStreamHandlerFactory`注册为`URL`的URL流处理程序工厂，然后使用`FileSystem.get()`方法从HDFS中获取文件的`FileSystem`实例。接着，我们使用`MyFSDataInputStream`读取文件内容，并使用`BufferedReader`按行读取文件内容并输出到终端。最后，我们需要关闭所有打开的流和文件系统实例。

阅读全文

相关推荐

HDFS.zip_Hadoop 平台_hadoop_hdfs

数据科学导论实验报告 实验2:熟悉常用的HDFS操作

第一次试验-HDFS1

编程实现一个类“MyFSDataInputStream”，该类继承“org.apache.hadoop.fs.FSDataInput Stream”，要求如下:实现按行读取HDFS中指定文件的方法“r

用虚拟机编程实现一个类MyFSDataInputStream 该类继org.apache.hadoop.fs.FSDatalnput Stream”，要求如下：实现按行读取 HDFS中指定文件的方法“readLine()”，如果读到文件末尾，则返回空，否则返回文件一行的文本

编程实现一个类“myfsdatainputstream”，该类继承“org.apache.hadoop.fs.fsdatainputstream”，要求如下：实现按行读取hdfs中指定文件的方法“readline()”，如果读到文件末尾，则返回空，否则返回文件一行的文本。

编程实现一个类“MyFSDataInputStream”，该类继承“org.apache.hadoop.fs.FSDataI nputStream”，要求如下：实现按行读取 HDFS 中指定文件的方法“readLine()”，如果读到 文件末尾，则返回空，否则返回文件一行的文本。

seatunnel java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FSDataInputStream

exception in thread "main" java.lang.noclassdeffounderror: org/apache/hadoop/fs/fsdatainputstream

使用 FSDataInputStream获取 HDFS 的 /user /hadoop/目录下的 task.txt 的文件内容，并输出，其 uri / hdfs://localhost: 9000/user/hadoop/task.txt

Exception in thread "main" java.lang.ClassNotFoundException: BigData.wordcount1

HDFS编程实践：编写一个Java程序，实现对指定HDFS目录下的所有文件先进行过滤，在进行合并成一个大文件，并放在指定输出目录下。过滤的目标是对后缀是“.doc”的文件进行过滤。

在idea中编程实现查看hdfs上的文件内容

如何通过Hadoop API访问这个文件？

hadoop hdfs api 测试代码使用HDFS Java API在HDFS的/user/hadoop目录上创建一个目录test。 在test目录中创建一个文件mytest.txt,在该文件中写入内容Hadoop is very easy to learn。 读取刚刚创建mytest.txt文件中的内容，输出文件内容并换行。

试编写程序，要求在HDFS文件系统中建立一个目录test，在test目录下创建文本文件file，并将该文件从HDFS下载到本地文件。

第1关：HDFS Java API编程 ——文件读写

请一次性展示出HDFS Java API编程 ——文件下载的代码文件

hdfs java api调用 实现文件的读写与上传下载

最新推荐

hadoop api.doc

HDFS FS API

火炬连体网络在MNIST的2D嵌入实现示例

管理建模和仿真的文件

L2正则化的终极指南：从入门到精通，揭秘机器学习中的性能优化技巧

如何构建一个符合GB/T19716和ISO/IEC13335标准的信息安全事件管理框架，并确保业务连续性规划的有效性？

Angular插件增强Application Insights JavaScript SDK功能

"互动学习：行动中的多样性与论文攻读经历"

L1正则化模型诊断指南：如何检查模型假设与识别异常值（诊断流程+案例研究）

如何构建一个符合GB/T19716和ISO/IEC13335标准的信息安全事件管理框架，并确保业务连续性规划的有效性？

数据科学导论实验报告实验2:熟悉常用的HDFS操作

编程实现一个类“MyFSDataInputStream”，该类继承“org.apache.hadoop.fs.FSDataI nputStream”，要求如下：实现按行读取 HDFS 中指定文件的方法“readLine()”，如果读到文件末尾，则返回空，否则返回文件一行的文本。

hadoop hdfs api 测试代码使用HDFS Java API在HDFS的/user/hadoop目录上创建一个目录test。在test目录中创建一个文件mytest.txt,在该文件中写入内容Hadoop is very easy to learn。读取刚刚创建mytest.txt文件中的内容，输出文件内容并换行。

hdfs java api调用实现文件的读写与上传下载