顶部
收藏

大数据分析与应用(初级)


作者:
阿里云计算有限公司
定价:
52.80元
ISBN:
978-7-04-055425-0
版面字数:
390.000千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2021-07-05
读者对象:
高等职业教育
一级分类:
计算机大类
二级分类:
计算机类
三级分类:
计算机应用技术

本书为大数据分析与应用1+X证书制度系列教材,依据《大数据分析与应用职业技能等级标准(初级)》编写。全书对标准中涉及的大数据分析与应用的基础知识及技能等进行分析和归纳,并充分考虑学习过程中的可操作性与学习效果,通过理论+实操的形式,使读者能够学以致用、举一反三。

本书主要介绍大数据分析与应用的基础知识及技能,共分为3篇:第1篇大数据基础,主要讲解大数据及大数据分析的基本概念;第2篇数据分析处理,主要讲解SQL基础、数据采集与同步、数据质量管理与数据清洗、数据分析、数据仓库;第3篇数据可视化,主要讲解数据可视化的基础概念、数据分析报表制作。通过学习本书,读者可掌握数据分析基础理论知识和基本技能,完成基本的数据分析工作。

本书配套电子课件(PPT)、案例素材、习题解答等数字化学习资源,教师可发邮件至编辑邮箱1548103297@qq.com索取相关教学资源。

本书可作为大数据分析与应用1+X职业技能等级证书(初级)认证的相关教学和培训教材,也可作为云计算、大数据相关专业技术人员的学习和参考用书。

  • 前辅文
  • 第1篇 大数据基础
    • 第1章 大数据概述
      • 1.1 什么是大数据
        • 1.1.1 大数据的定义
        • 1.1.2 大数据的特征
        • 1.1.3 大数据的应用
        • 1.1.4 大数据的意义与发展趋势
      • 1.2 大数据技术概览
        • 1.2.1 Hadoop生态系统
        • 1.2.2 阿里云大数据平台
      • 1.3 本章小结
      • 1.4 本章习题
    • 第2章 大数据分析概述
      • 2.1 什么是大数据分析
        • 2.1.1 大数据分析的产生与发展
        • 2.1.2 大数据分析的应用场景
      • 2.2 大数据分析的流程与常用技术
        • 2.2.1 大数据采集技术
        • 2.2.2 大数据预处理技术
        • 2.2.3 大数据存储与管理技术
        • 2.2.4 大数据分析技术
        • 2.2.5 大数据可视化技术
      • 2.3 实战案例1——从Excel中初窥数据分析
      • 2.4 实战案例2——初识阿里云大数据计算服务
      • 2.5 本章小结
      • 2.6 本章习题
  • 第2篇 数据分析处理
    • 第3章 SQL基础
      • 3.1 SQL概述
        • 3.1.1 SQL的产生和发展
        • 3.1.2 SQL的分类
        • 3.1.3 大数据分析中的SQL
      • 3.2 数据定义语言
        • 3.2.1 创建数据库/数据表
        • 3.2.2 修改数据库/数据表
        • 3.2.3 删除数据库/数据表
      • 3.3 数据操纵语言
        • 3.3.1 表记录的插入
        • 3.3.2 表记录的修改
        • 3.3.3 表记录的删除
      • 3.4 数据查询语言
        • 3.4.1 基本查询 SELECT
        • 3.4.2 条件查询 WHERE
        • 3.4.3 模糊匹配 LIKE
        • 3.4.4 范围条件匹配查BETWEEN
        • 3.4.5 集合判断IN
        • 3.4.6 空值查询
        • 3.4.7 排序 ORDER BY
        • 3.4.8 限制结果数 LIMIT
        • 3.4.9 去重DISTINCT
        • 3.4.10 连接查询 JOIN
        • 3.4.11 聚合函数
        • 3.4.12 分组查询 GROUP BY和HAVING
        • 3.4.13 子查询
        • 3.4.14 分支判断
        • 3.4.15 联合查询UNION
      • 3.5 MaxCompute SQL介绍
        • 3.5.1 数据的组织
        • 3.5.2 数据类型
        • 3.5.3 MaxCompute SQL语法
        • 3.5.4 表操作
        • 3.5.5 生命周期操作
        • 3.5.6 添加和删除分区
        • 3.5.7 更新表中数据INSERT OVERWRITE/INTO
        • 3.5.8 查询操作SELECT
      • 3.6 实战案例——MaxCompute SQL基本操作
      • 3.7 本章小结
      • 3.8 本章习题
    • 第4章 数据采集与同步
      • 4.1 数据采集概述
        • 4.1.1 大数据的来源
        • 4.1.2 数据采集方法
        • 4.1.3 数据采集途径
        • 4.1.4 数据存储
      • 4.2 系统日志采集
        • 4.2.1 日志采集的目的
        • 4.2.2 日志采集的过程
      • 4.3 网络数据采集
        • 4.3.1 爬虫技术概述
        • 4.3.2 爬虫工作原理
        • 4.3.3 网络爬虫框架
        • 4.3.4 Web页面数据采集
      • 4.4 数据同步
        • 4.4.1 数据同步概述
        • 4.4.2 数据库数据同步到大数据平台
      • 4.5 实战案例——电商数据同步实验
      • 4.6 本章小结
      • 4.7 本章习题
    • 第5章 数据质量管理与数据清洗
      • 5.1 数据质量概述
        • 5.1.1 数据质量的定义
        • 5.1.2 数据质量问题的来源
        • 5.1.3 数据质量问题分类
        • 5.1.4 数据质量管理的必要性
      • 5.2 数据质量管理标准
        • 5.2.1 数据完整性
        • 5.2.2 数据唯一性
        • 5.2.3 数据及时性
        • 5.2.4 数据有效性
        • 5.2.5 数据准确性
        • 5.2.6 数据一致性
      • 5.3 数据清洗技术
        • 5.3.1 数据清洗概述
        • 5.3.2 数据清洗关键技术
        • 5.3.3 数据清洗常用工具
      • 5.4 数据规约
      • 5.5 数据变换
      • 5.6 实战案例——数据质量管理
      • 5.7 本章小结
      • 5.8 本章习题
    • 第6章 数据分析
      • 6.1 数据分析指标与实现
        • 6.1.1 什么是数据指标
        • 6.1.2 数据指标的组成
        • 6.1.3 数据指标的分类
        • 6.1.4 数据指标的价值
        • 6.1.5 优秀的数据指标的特征
        • 6.1.6 数据分析指标的实现
      • 6.2 阿里云大数据计算服务(MaxCompute)
        • 6.2.1 MaxCompute介绍
        • 6.2.2 MaxCompute 的使用流程
        • 6.2.3 MaxCompute SQL的函数
      • 6.3 阿里云数据工场(DataWorks)
        • 6.3.1 DataWorks的使用流程
        • 6.3.2 DataWorks任务开发
        • 6.3.3 DataWorks数据集成
        • 6.3.4 DataWorks 数据调度
        • 6.3.5 DataWorks数据运维
      • 6.4 实战案例——电商数据分析实验
      • 6.5 本章小结
      • 6.6 本章习题
    • 第7章 数据仓库
      • 7.1 数据仓库概述
        • 7.1.1 数据仓库的概念
        • 7.1.2 数据仓库中的术语名词
        • 7.1.3 数据仓库与数据库
        • 7.1.4 数据仓库的常见应用
        • 7.1.5 数据仓库系统的组成
      • 7.2 数据仓库设计与实现
        • 7.2.1 数据仓库设计原则
        • 7.2.2 数据仓库构建模式
        • 7.2.3 数据仓库设计步骤
      • 7.3 数据仓库的数据模型
        • 7.3.1 数据概述与设计原则
        • 7.3.2 概念模型
        • 7.3.3 逻辑模型
        • 7.3.4 物理模型
      • 7.4 ETL
        • 7.4.1 数据抽取
        • 7.4.2 数据转换
        • 7.4.3 数据加载
      • 7.5 阿里云数据仓库技术
        • 7.5.1 阿里云数据仓库常用产品
        • 7.5.2 阿里云技术搭建数据仓库流程
      • 7.6 实战案例——基于阿里云构建数据仓库
      • 7.7 本章小结
      • 7.8 本章习题
  • 第3篇 数据可视化
    • 第8章 数据可视化概述
      • 8.1 什么是数据可视化
        • 8.1.1 数据可视化的定义
        • 8.1.2 数据可视化的作用
        • 8.1.3 数据可视化的分类
      • 8.2 数据可视化原则
        • 8.2.1 数据筛选
        • 8.2.2 数据到可视化的直观映射
        • 8.2.3 视觉选择与交互设计
      • 8.3 基本图表类型
      • 8.4 数据可视化工具
        • 8.4.1 入门级工具(Excel)
        • 8.4.2 编程语言(R语言和Python语言)
        • 8.4.3 商业工具(Tableau和QlikView)
        • 8.4.4 阿里云数据可视化工具Quick BI
      • 8.5 本章小结
      • 8.6 本章习题
    • 第9章 数据分析报表制作
      • 9.1 BI报表制作
        • 9.1.1 BI报表概述
        • 9.1.2 BI报表制作流程
        • 9.1.3 实战案例——制作企业数据BI分析报表
      • 9.2 数据分析报告撰写
        • 9.2.1 数据分析报告撰写原则
        • 9.2.2 数据分析报告的结构
        • 9.2.3 数据分析报告撰写流程
      • 9.3 本章小结
      • 9.4 本章习题
    • 参考文献

相关图书