顶部
收藏

大数据基础


作者:
胡坚 张红
定价:
37.00元
ISBN:
978-7-04-061342-1
版面字数:
240.000千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2024-02-27
读者对象:
高等职业教育
一级分类:
计算机大类
二级分类:
计算机类
三级分类:
计算机应用技术

本书是高等职业教育计算机类课程新形态一体化教材。

本书是一本面向大数据基础知识学习、基本技能训练和场景应用的项目化教程。全书共分为8个单元,内容包括初识大数据、Linux应用基础、大数据存储与计算、大数据编程基础、数据采集与预处理、数据分析与挖掘、数据可视化、大数据典型行业应用分析。本书知识点全面,且融合了大数据应用开发的新技术和多个典型行业应用场景,突出情境案例导引、知识技能讲解和入门项目训练,并同步开发一个完整的企业级项目—酒店电商数据分析系统,重在培养学生的大数据思维和综合应用能力。

本书配有微课视频、课程标准、授课计划、授课用PPT、源代码、习题答案、习题库等丰富的数字化教学资源。与本书配套的在线开放课程“大数据基础”在“智慧职教MOOC学院”平台(mooc.icve.com.cn)上线,学习者可登录平台进行在线学习,授课教师可调用本课程构建符合自身教学特色的SPOC课程,详见“智慧职教”服务指南。教师也可发邮件至编辑邮箱1548103297@qq.com获取相关资源。

本书可作为高等职业院校计算机类专业的大数据基础课程教材,也可供大数据技术相关岗位工作人员参考使用,还可作为广大大数据技术爱好者的零基础入门教程。

  • 前辅文
  • 单元1 初识大数据
    • 单元重点
    • 案例资源
    • 单元导引
    • 1.1 什么是大数据
      • 1.1.1 大数据的诞生
      • 1.1.2 大数据的概念及特点
    • 1.2 大数据系统组成
    • 同步训练
      • 训练:大数据技术体系调研分析
    • 单元小结
    • 单元测试
  • 单元2 Linux应用基础
    • 单元重点
    • 案例资源
    • 单元导引
    • 2.1 Linux系统简介
    • 2.2 Linux的安装与使用
      • 2.2.1 Linux在虚拟机中的安装
      • 2.2.2 Vi编辑器的使用
    • 2.3 Linux常用命令
      • 2.3.1 文件操作
      • 2.3.2 目录操作
      • 2.3.3 用户操作
    • 同步训练
      • 训练2-1:Linux数据文件管理
      • 训练2-2:Linux系统日志采集
    • 综合案例
      • 案例1:酒店运营数据分析(一)—酒店大数据分析环境配置
    • 单元小结
    • 单元测试
  • 单元3 大数据存储与计算
    • 单元重点
    • 案例资源
    • 单元导引
    • 3.1 分布式存储
      • 3.1.1 分布式存储概述
      • 3.1.2 HDFS工作原理
      • 3.1.3 HDFS基础命令
    • 3.2 分布式计算
      • 3.2.1 分布式计算概述
      • 3.2.2 MapReduce计算框架
    • 同步训练
      • 训练:新闻词频统计
    • 单元小结
    • 单元测试
  • 单元4 大数据编程基础
    • 单元重点
    • 案例资源
    • 单元导引
    • 4.1 Python概述
      • 4.1.1 Python语言简介
      • 4.1.2 Python的安装与使用
    • 4.2 Python基础
      • 4.2.1 数据类型和表达式
      • 4.2.2 基本流程控制结构
    • 4.3 Scala语言
      • 4.3.1 Scala简介
      • 4.3.2 Scala的安装与使用
      • 4.3.3 Scala语法基础
    • 同步训练
      • 训练:店铺宝贝价格排序
    • 单元小结
    • 单元测试
  • 单元5 数据采集与预处理
    • 单元重点
    • 案例资源
    • 单元导引
    • 5.1 数据采集
      • 5.1.1 数据采集原理
      • 5.1.2 BeautifulSoup网络数据采集
    • 5.2 数据预处理
      • 5.2.1 数据预处理原理
      • 5.2.2 Pandas数据预处理
    • 同步训练
      • 训练:爬取二手房网站数据
    • 综合案例
      • 案例2:酒店运营数据分析(二)—酒店数据爬虫与清洗
    • 单元小结
    • 单元测试
  • 单元6 数据分析与挖掘
    • 单元重点
    • 案例资源
    • 单元导引
    • 6.1 数据分析与挖掘简介
      • 6.1.1 数据分析简介
      • 6.1.2 数据挖掘简介
      • 6.1.3 Pandas数据分析
    • 6.2 数据挖掘算法
      • 6.2.1 数据挖掘算法分类
      • 6.2.2 数据挖掘算法典型应用
    • 同步训练
      • 训练:Python电商数据分析
    • 综合案例
      • 案例3:酒店运营数据分析(三)—订单数据分析
    • 单元小结
    • 单元测试
  • 单元7 数据可视化
    • 单元重点
    • 案例资源
    • 单元导引
    • 7.1 可视化概述
      • 7.1.1 什么是数据可视化
      • 7.1.2 可视化的重要作用
    • 7.2 可视化工具
      • 7.2.1 ECharts数据可视化
      • 7.2.2 PyEcharts数据可视化
      • 7.2.3 Matplotlib数据可视化
    • 同步训练
      • 训练7-1:PyEcharts展示电商交易数据
      • 训练7-2:Matplotlib展示气温变化
    • 综合案例
      • 案例4:酒店运营数据分析(四)—酒店数据可视化
    • 单元小结
    • 单元测试
  • 单元8 大数据典型行业应用分析
    • 单元重点
    • 案例资源
    • 单元导引
    • 8.1 大数据在电子商务中的应用
    • 8.2 大数据在金融行业中的应用
    • 8.3 大数据在物流行业中的应用
    • 8.4 大数据在医疗行业中的应用
    • 8.5 大数据在智慧农业中的应用
    • 同步训练
      • 训练:信用评分卡
    • 单元小结
    • 单元测试
  • 参考文献

相关图书