InputFormat描述了Map-
Reduce作业的输入规范。默认情况下,hadoop使用
TextInputFormat继承自的
FileInputFormat来处理输入文件。
我们还可以指定在客户端或驱动程序代码中使用的输入格式:
job.setInputFormatClass(SomeInputFormat.class);
对于
TextInputFormat,文件分为几行。键是文件中的位置,值是文本行。
在中
public void map(Object key, Text value, Context context), 键 是行偏移量,
值 是实际文本。
请查看TextInputFormat API
https://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapreduce/lib/input/TextInputFormat.html
默认情况下,关键是
LongWritable类型和价值类型是
Text为
TextInputFormat你的榜样,对象类型在的地方。在指定的
LongWritable,因为它是兼容的。您也可以使用
LongWritabletype代替
Object



