Hadoop序列化机制详解：Writable接口和序列化格式

需积分: 0 175 浏览量更新于2024-06-24 收藏 726KB DOC 举报

Java-Hadoop序列化序列化是指把结构化对象转化为字节流的过程，而反序列化是序列化的逆过程，即把字节流转回结构化对象。Java序列化是通过实现java.io.Serializable接口来实现的，而Hadoop序列化则是通过Writable接口来实现的。 Hadoop序列化的特点是紧凑、快速、可扩展和互操作的。紧凑是指高效使用存储空间，快速是指读写数据的额外开销小，可扩展是指可透明地读取老格式的数据，互操作是指支持多语言的交互。 Writable接口是Hadoop序列化的核心，它是根据DataInput和DataOutput实现的简单、有效的序列化对象。MapReduce的任意Key和Value必须实现Writable接口，而WritableComparable接口是Writable接口的子接口，用于比较和排序。在Hadoop中，Writable接口的实现类有很多，例如Text、IntWritable、LongWritable等。Text是Hadoop中最基本的Writable实现类，它等价于java.lang.String的Writable，用于序列化UTF-8编码的字符串。自定义Writable实现类是通过实现Writable接口并重写write和readFields方法来实现的。例如FlowBean.java就是一个自定义的Writable实现类，它用于序列化电信流量数据。 Hadoop序列化的作用非常重要，它在分布式环境中有两大作用：进程间通信和永久存储。在Hadoop节点间通信中，序列化用于把数据从一个节点传输到另一个节点，而在永久存储中，序列化用于把数据存储到文件系统中。 Hadoop序列化是Hadoop框架中一个非常重要的组件，它用于把结构化对象转化为字节流，以便在分布式环境中进行数据传输和存储。通过实现Writable接口，开发者可以自定义自己的序列化格式，以满足特定的需求。

this.down_flow = down_flow;

this.sun_flow = up_flow+down_flow;

}

public String getPhoneNB() {

return phoneNB;

}

public void setPhoneNB(String phoneNB) {

this.phoneNB = phoneNB;

}

public long getUp_flow() {

return up_flow;

}

public void setUp_flow(long up_flow) {

this.up_flow = up_flow;

}

public long getDown_flow() {

return down_flow;

}

public void setDown_flow(long down_flow) {

this.down_flow = down_flow;

}

public long getSun_flow() {

return sun_flow;

}

public void setSun_flow(long sun_flow) {

this.sun_flow = sun_flow;

}

//将对象数据序列化到输入流

@Override

public void write(DataOutput out) throws IOException {

out.writeUTF(phoneNB);

out.writeLong(up_flow);

out.writeLong(down_flow);

out.writeLong(sun_flow);

}

//将输入流中的数据序列化为输出流

@Override

public void readFields(DataInput in) throws IOException {

phoneNB = in.readUTF();

up_flow = in.readLong();

down_flow = in.readLong();

sun_flow = in.readLong();

}

@Override

剩余19页未读，继续阅读

paterWang

粉丝: 1217
资源: 1667

Hadoop序列化机制详解：Writable接口和序列化格式

Java Object & Hadoop序列化深度解析：持久化与通信的关键技术

Hadoop序列化与反序列化详解

MapReduce与Hadoop序列化：详解接口实现与案例

Hadoop - Hadoop Streaming

spark-2.1.2-bin-hadoop2.7

protobuf-hadoop

spark-2.4.2-bin-hadoop2.7.tgz

spark-1.3.1-bin-hadoop2.6.tgz

深入浅析Java Object Serialization与 Hadoop 序列化

quantum-hadoop:量子计算对Hadoop仿真

最新资源