MARC状态:审校 文献类型:中文图书 浏览次数:30
- 题名/责任者:
- 大数据技术及应用:基于Python语言/严宣辉 ... [等] 编著
- 出版发行项:
- 北京:电子工业出版社,2021.10
- ISBN及定价:
- 978-7-121-42169-3/CNY69.00
- 载体形态项:
- xii, 345页:图;26cm
- 丛编项:
- 新工科·数据科学与大数据系列
- 个人责任者:
- 严宣辉 编著
- 个人责任者:
- 张仕 编著
- 个人责任者:
- 赖会霞 编著
- 学科主题:
- 数据处理-高等学校-教材
- 中图法分类号:
- TP274
- 题名责任附注:
- 题名页题: 严宣辉, 张仕, 赖会霞, 韩凤萍编著
- 书目附注:
- 有书目
- 提要文摘附注:
- 本书共9章, 围绕大数据的基本概念和大数据处理的主要环节编写。第1章主要介绍大数据的概念、特点和构成; 第2章主要介绍在Windows系统中安装Linux虚拟机及构建Hadoop分布式集群的方法; 第3章主要介绍大数据采集工具的使用及数据预处理的常用方法; 第4章首先介绍Hadoop的发展历史、软件生态、核心组件和命令结构, 然后以HDFS为重点, 介绍其体系结构和特点, 并详细介绍HDFS的交互式命令; 第5章介绍大数据环境下存储工具HBase的数据模型; 第6章介绍Hive的存储模型, 第7章介绍在Hadoop平台上利用Python设计MapReduce程序的基本思路; 第8章介绍大数据分析与挖掘过程中的常用算法; 第9章介绍数据可视化的常用方法及常用工具。本书的内容与实际应用紧密结合, 目的是让读者能了解大数据的基本概念、理解大数据技术的基本原理、初步掌握大数据处理和分析的基本方法, 为未来应用大数据思维和大数据分析方法解决工作中的实际问题打下良好的基础。
- 使用对象附注:
- 本书适合作为高等学校计算机类和电子信息类相关专业大数据技术相关课程的教材, 可供本科生、研究生使用, 同时也适合对大数据技术感兴趣的广大读者进行自学和实践时使用
全部MARC细节信息>>



