STORED AS INPUTFORMAT
时间: 2024-10-12 21:05:37 浏览: 19
Procedures Triggers User-Defined Functions on DB2 Universal Database for iSeries
"STORED AS INPUTFORMAT"是一个Hadoop MapReduce编程模型中的概念,它用于指定数据源如何被读取并转化为可以供MapReduce任务使用的输入。InputFormat是一个接口,提供了一个方法`getSplits()`,用于分割数据成多个小块(split),每个小块会被分配给map任务处理。当数据存储为特定格式时(如文本文件、序列文件等),你需要指定一个实现了InputFormat接口的类,比如TextInputFormat(文本文件)或SequenceFileInputFormat(二进制序列文件)。这样,Hadoop会知道如何解析这些文件内容,并创建适当的输入对象。
例如,在Hadoop Streaming或编写自定义Mapper程序时,你可能会看到这样的配置:
```xml
<configuration>
<property>
<name>input.format.class</name>
<value>org.apache.hadoop.mapreduce.lib.input.TextInputFormat</value>
</property>
</configuration>
```
这里指定了TextInputFormat作为输入格式,意味着Hadoop将按照行的方式读取文本文件。
阅读全文