本节中,你将开发你的第一个Hadoop程序。开发此程序使用的开发环境是带有Maven插件的Eclipse。如果你使用Cloudera公司的虚拟机,开发环境已经预先安装于其中了。附录B讲解了如何在Eclipse中创建一个Maven工程。
首先创建一个空的Maven工程,并将所需依赖库添加其中。项目对象模型(Project Object Model,POM)如代码清单3-1所示。创建一个文件名为pom.xml的文件,把代码清单3-1中的代码拷贝到该文件中。
现在可以开发你的第一个MapReduce程序,并在本地运行它。但是,让人迷惑的是有两套MapReduce API:新API和旧API。旧API已经被废弃了,但之前已经被广泛地使用。我们会使用两套API来运行作业程序,以便你熟悉了解它们。
你无须自己动手编写上面的代码。在Apress.com站点上找到关于本书的目录页,你会在该目录页上发现一个标签,点击该标签就可以下载一个ZIP压缩文档,该文档中包含了所有的代码文件。