MARC状态:审校 文献类型:中文图书 浏览次数:16
- 题名/责任者:
- 大数据技术入门:Hadoop+Spark/于海浩, 刘志坤主编
- 出版发行项:
- 北京:清华大学出版社,2022.01
- ISBN及定价:
- 978-7-302-59181-8/CNY49.90
- 载体形态项:
- 194页:图;26cm
- 丛编项:
- 大数据与人工智能技术丛书
- 个人责任者:
- 于海浩 主编
- 个人责任者:
- 刘志坤 主编
- 学科主题:
- 数据处理软件
- 中图法分类号:
- TP274
- 书目附注:
- 有书目
- 提要文摘附注:
- 本书基础理论、应用开发以及实际案例相结合, 围绕Hadoop、Spark生态圈循序渐进介绍关于大数据技术领域中的基础知识、应用开发技术和基于Spark的常见机器学习算法, 最后以两个实战案例全面、系统地应用了本书介绍的基础知识和应用开发方法。全书共14章, 分别为大数据概述、Hadoop简介及安装部署、HDFS分布式文件系统、MapReduce计算框架、Hive数据仓库、HBase分布式数据库、Spark基础、Spark RDD弹性分布式数据集、Spark SQL、Spark Streaming实时计算框架、Spark Streaming与Flume、Kafka的整合、Spark MLlib机器学习、实战案例-分布式优惠券后台应用系统、实战案例-新闻话题实时统计分析, 书中的每个知识点都有相应的实现代码和实例。
全部MARC细节信息>>



