实战Hadoop


实战Hadoop

文章插图
实战Hadoop【实战Hadoop】《实战Hadoop》是中国电子学会云计算专家委员会刘鹏教授主编的国内第一本原着的Hadoop编程技术书籍 。它由电子工业出版社于2011年9月出版,并在首届中国云计算技术与套用大会上首发 。作为谷歌云计算技术的开源实现,Hadoop是目前最受关注的云计算技术平台 。该书强调动手、强调实战,以风趣幽默的语言和一系列生动的套用实例,系统地讲授了Hadoop的核心技术和扩展技术,包括:MapReduce、HDFS、HBase、Hive、Pig、Cassandra、Chukwa和ZooKeeper等,并给出了3个完整的基于Hadoop的云计算综合套用实例,及保障Hadoop平台可靠运行的方法 。本书主要作者来自国内少有的拥有丰富经验的云计算技术研发团队 。
基本介绍书名:实战Hadoop
作者:刘鹏
出版社:电子工业出版社
出版时间:2011年9月
读者对象云计算研发人员,包括院校、科研机构师生和科研人员,各类云计算技术企业和套用企业研发人员图书目录第1章 神奇的大象——Hadoop1.1 初识神象 1.2 Hadoop初体验 1.3 Hadoop世界的风俗第2章 分久必合——MapReduce2.1 MapReduce基础2.2 一切从“Hello World”开始——文字计数2.3 MapReduce,你够了解吗?2.5 实战:倒排索引2.4 实战:用MapReduce进行海量数据排序第3章 HDFS:不怕故障的海量存储3.1 开源的GFS——HDFS 3.3 HDFS API之旅 3.4 档案操作示例3.5 实战:用HDFS存储海量视频数据第4章 HBase:一张无限大的表4.1 HBase数据模型4.2 HBase的入门仪式4.3 HBase操作演练4.4 HBase查询语言HBQL4.4 实战:用HBase管理通话记录数据第5章 MapReduce进阶5.1複合键值对的使用5.1.1用複合键让系统完成排序5.1.2把小的键值对合併成大的键值对5.2用户定製数据类型5.2.1 Hadoop内置的数据类型5.2.2用户自定义数据类型的实现5.3用户定製输入输出格式5.3.1 Hadoop内置的档案输入格式和RecordReader5.3.2用户自定义InputFormat和RecordReader示例5.3.3 Hadoop内置的档案输出格式和RecordWriter5.3.4用户自定义OutputFormat和RecordWriter示例5.4用户定製Partitioner和Combiner5.4.1用户定製Partitioner5.4.2用户定製Combiner5.5叠代完成MapReduce计算5.5.1基本问题5.5.2叠代MapReduce计算任务示例5.6複合MapReduce计算过程的实现5.6.1顺序化MapReduce任务的执行5.6.2具有数据依赖关係的MapReduce任务的执行5.6.3 MapReduce前处理和后处理步骤的链式执行5.7多数据源的连线5.7.1基本问题5.7.2用DataJoin类实现Reduce端Join5.7.3用档案複製方法实现Map端Join5.7.4带Map端过滤的Reduce端Join5.7.5多数据源连线解决方法的限制5.8全局参数/数据档案的传递5.8.1全局作业参数的传递5.8.2全局数据档案的传递5.9 关係资料库的连线与访问5.9.1从资料库中输入数据5.9.2向资料库中输出计算结果5.10其它处理技术5.10.1查询任务相关信息5.10.2划分多个输出档案集合第6章 Hive:飞进数据仓库的小蜜蜂6.1 搭建蜂房——Hive安装6.2 Hive的服务6.3 HiveQL的使用6.4 Hive示例6.5 实战:?第7章 Pig:一头什幺都能吃的猪7.1 Pig的安装7.2 Pig Shell的使用7.3 Pig Latin程式语言7.4 Pig示例7.5 实战:?第8章 Cassandra:来自Facebook的女神8.1 让Canssandra飞起来8.2 洞察Cassandra的全貌8.3 Cassandra与Hadoop联姻8.4 Cassandra操作示例8.5 实战:?第9章 Chukwa:收集数据的大乌龟9.1 Chukwa安装与配置9.2 Chukwa的设计9.3 Chukwa实践之路9.4 实战:?第10章 动物管理员ZooKeeper10.1 谁动了ZK的钥匙10.2 ZK是个谜10.3 何去何从的ZK10.4 ZooKeeper演练10.5 实战:?第11章 综合实战:打造一个搜寻引擎第12章 综合实战:生物信息学套用第13章 综合实战:行动网路信令监测第14章 高枕无忧:Hadoop容错