MARC状态:审校 文献类型:中文图书 浏览次数:21
- 题名/责任者:
- Hadoop构建数据仓库实践/王雪迎著
- 出版发行项:
- 北京:清华大学出版社,2017.07
- ISBN及定价:
- 978-7-302-46980-3/CNY89.00
- 载体形态项:
- 444页;26cm
- 个人责任者:
- 王雪迎 著
- 学科主题:
- 数据处理
- 中图法分类号:
- TP274
- 提要文摘附注:
- 本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。本书内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训机构相关专业的师生教学参考。
- 使用对象附注:
- 信息科技类专业(大众读者)
全部MARC细节信息>>



