MARC状态:审校 文献类型:中文图书 浏览次数:24
- 题名/责任者:
- Apache Spark大数据分析:基于Azure Databricks云平台/(瑞典) 罗伯特·伊利杰森著 袁国忠译
- 出版发行项:
- 北京:人民邮电出版社,2023.6
- ISBN及定价:
- 978-7-115-61456-8/CNY79.80
- 载体形态项:
- 236页:图;23cm
- 统一题名:
- Beginning apache spark using azure databrick : unleashing large cluster analytics in the cloud
- 个人责任者:
- 伊利杰森 (Ilijason, Robert) 著
- 个人次要责任者:
- 袁国忠 译
- 学科主题:
- 数据处理软件-机器学习
- 中图法分类号:
- TP274
- 出版发行附注:
- 本书中文简体字版由Apress Media, LLC授权人民邮电出版社有限公司独家出版
- 责任者附注:
- 罗伯特·伊利杰森 (Robert Ilijason), 商务智能领域深耕20年的战场老兵, 曾担任过欧洲一些大公司的外包人, 并在零售、电信、银行、政府机构等领域做过大规模数据分析项目。
- 提要文摘附注:
- 本书总计11章, 首先介绍大规模数据分析相关的概念; 然后介绍受管的Spark及其与Databricks的关系, 以及Databricks的版本差异和使用方法 (涵盖工作区、集群、笔记本、Databricks文件系统、数据导入/导出等内容); 接着介绍使用SQL 和Python分别实现数据分析的过程, 数据提取、变换、加载、存储、优化技巧等高阶数据处理方法以及外部连接工具、生产环境集成等内容; 最后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。
- 使用对象附注:
- 本书可供数据工程师、数据分析师和决策分析人员等学习和参考
全部MARC细节信息>>



