本书是国家职业教育大数据技术专业教学资源库配套教材。
本书主要介绍Spark 分布式计算框架的应用,重点是流式模块Spark Streaming 在实际项目中的应用,并通过一个实战项目来辅助读者学习实时数据处理场景。全书共分为6 章,主要内容包括绪论、Scala语言应用、Spark Streaming、Spark SQL、数据整合和Spark 优化。
本书配有微课视频、授课用PPT、教学设计、课程标准、案例源码等丰富的数字化学习资源。与本书配套的数字课程“实时数据处理技术”在“智慧职教”平台(www.icve.com.cn)上线,学习者可以登录平台进行在线学习及资源下载,授课教师可以调用本课程构建符合自身教学特色的SPOC 课程,详见“智慧职教”服务指南。教师也可发邮件至编辑邮箱1548103297@qq.com 获取相关资源。
本书内容翔实、理实一体,既可作为高职高专院校大数据技术专业的数据处理课程教材,也可作为从事大数据相关工作的技术人员的入门参考书。