本书包括引言、大数据的预处理、云计算和可视化、回归与分类、聚类及相关数据分析方法、高维统计中的变量选择、神经网络与深度学习、深度学习在人工智能中的应用七章,主要介绍大数据技术的基本原理和方法,特别是以机器模型为主的各类数据模型以及它们的计算方法,也会提及这些方法在某些领域(如人工智能)中的应用。
本书可作为高等学校大数据及相关专业本科生与研究生的教材或参考书,也可供相关的科技工作者阅读、参考。
- 前辅文
- 第一章 引言
- 1.1 什么是大数据
- 1.2 数据分析过程
- 1.3 专业领域知识
- 1.4 数据科学家做什么
- 习题
- 第二章 大数据的预处理、云计算和可视化
- 2.1 大数据的数据结构和形式
- 2.2 数据清洗
- 2.3 云计算和云存储
- 2.4 数据可视化
- 习题
- 第三章 回归与分类
- 3.1 线性回归
- 3.2 线性回归的推广
- 3.3 逻辑斯谛回归
- 3.4 判别分类
- 3.5 k最近邻分类
- 3.6 决策树
- 3.7 Bagging分类
- 3.8 随机森林分类
- 3.9 AdaBoost算法分类
- 3.10 支持向量机
- 3.11 案例分析
- 习题
- 第四章 聚类及相关数据分析方法
- 4.1 聚类分析
- 4.2 EM算法
- 4.3 文本分析
- 4.4 关联规则和推荐系统
- 习题
- 第五章 高维统计中的变量选择
- 5.1 经典降维方法
- 5.2 正则化方法
- 5.3 自编码器
- 5.4 贝叶斯方法在变量选择中的应用
- 习题
- 第六章 神经网络与深度学习
- 6.1 人工智能、机器学习和深度学习的关系
- 6.2 神经网络
- 6.3 深度神经网络
- 6.4 卷积神经网络
- 6.5 循环神经网络
- 6.6 强化学习
- 6.7 其他的学习模型
- 习题
- 第七章 深度学习在人工智能中的应用
- 7.1 无人驾驶汽车
- 7.2 自然语言处理
- 7.3 医疗健康
- 7.4 图神经网络
- 7.5 推荐系统
- 习题
- 参考文献