用MapReduce运行wordcount

配置Hadoop请看链接here
在配置好Hadoop后我们需要运行MapReduce的经典例子wordcount来看一下
想要运行这个例子需要对hadoop的命令有所了解,可以用

1
hadoop fs -help

1.在hadoop的file system中建立一个input文件夹

1
hadoop fs -mkdir /input

2.将一些后缀为txt的文件上传到hadoop的input文件夹中,我当前terminal所在的目录有一些txt文件

1
hadoop fs -put *.txt /input

然后用下面命令查看是否上传成功

1
hadoop fs -ls /input

3.运行Map/Reduce

1
hadoop jar /home/dirk/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /input /output

会看到如下的输出信息

1
2
3
4
5
6
....
14/04/14 21:02:21 INFO mapreduce.Job: map 0% reduce 0%
14/04/14 21:02:25 INFO mapreduce.Job: map 67% reduce 0%
14/04/14 21:02:26 INFO mapreduce.Job: map 100% reduce 0%
14/04/14 21:02:31 INFO mapreduce.Job: map 100% reduce 100%
....

然后查看结果

1
hadoop fs -cat /output/part-r-00000