本书是大数据新兴领域“十四五”高等教育教材。本书围绕互联网领域大数据处理生态系统的典型架构,从“理解大数据”“处理大数据”以及“系统观建立”三个角度培养读者的大数据处理系统能力。对应以上三个角度的能力,本书从思维、编程、优化三个方面编写,即基础;。编程处理篇着重于数据处理本身,从应用编程、典型数据处理的角度讲解大数据批处理编程、流处理与图计算。系统与优化篇包含大数据系统资源管理以及大数据系统优化技术,讲解云计算环境下多任务管理机制、大数据分布式资源管理机制与服务协调机制,以及大数据处理系统优化的基本思路、关键组件分析和系统优化方法。
本书既可作为高等学校大数据相关专业的教学用书,也可供大数据领域专业技术人员参考。