本书重点介绍Python 在多元数据分析和统计建模方面的应用,内容包括三个方面:多元数据的基本分析及可视化、多元数据的无监督机器学习、多元数据的有监督机器学习。内容涉及多元统计分析及软件概述、多元数据的Python 处理、多元数据的Python 可视化、聚类分析及Python 分类、综合评价及Python 应用、主成分分析及Python 计算、因子分析及Python 应用、对应分析及Python 视图、相关与回归及Python 分析、典型相关分析及Python应用、扩展线性模型及Python 建模、判别分析及Python 算法。本书内容丰富、图文并茂、可操作性强且便于查阅,能有效帮助读者提高数据处理与统计分析的水平和效率。全书基于Anaconda 的Jupyter Notebook 进行数据的多元统计分析和课堂教学。作者还建立了学习网站(www.jdwbh.cn/Rstat)和博客(www.yuque.com/rstat),书中例题的数据、习题数据及Python 语言代码都可直接从上面下载使用,读者也可从封底的二维码中下载书中的数据和代码。
本书适合各个层次的多元数据分析学习者,既可作为机器学习初学者的入门指南,又可作为中、高级学习者的参考手册,同时还可作为各大中专院校和培训班的多元数据分析及Python 建模教材。
- 前辅文
- 上篇 多元数据的基本分析及可视化
- 第1章 多元统计分析及软件概述
- 1.1 多元统计分析的历史
- 1.2 多元统计分析的用途
- 1.3 多元统计分析的内容
- 1.4 统计分析软件及应用
- 1.5 Python 数据分析平台
- 案例1:Python 数据分析编程平台Spyder
- 思考与练习
- 第2章 多元数据的Python 处理
- 2.1 Python 的编程基础
- 2.2 Python 数值分析
- 2.3 多元数据的收集和整理
- 2.4 Python 的数据框
- 2.5 Python 数据框的分析
- 案例2:多元数据的基本统计分析
- 思考与练习
- 第3章 多元数据的Python 可视化
- 3.1 多元数据可视化准备
- 3.2 条图或柱图
- 3.3 描述统计及箱线图
- 3.4 变量间的关系图
- 3.5 其他多元分析图
- 案例3:城市现代化水平的直观分析
- 思考与练习
- 中篇 多元数据的无监督机器学习
- 第4章 聚类分析及Python 分类
- 4.1 聚类分析的概念、类型和特点
- 4.2 聚类统计量
- 4.3 系统聚类法
- 4.4 快速聚类法
- 案例4:全国区域经济发展的聚类分析
- 思考与练习
- 第5章 综合评价及Python 应用
- 5.1 综合评价的基本概念
- 5.2 评价指标体系的构建
- 5.3 数据无量纲化及权重确定
- 5.4 综合评价方法及其应用
- 案例5:广东省知识产权发展水平的综合评价
- 思考与练习
- 第6章 主成分分析及Python 计算
- 6.1 主成分分析的概念
- 6.2 主成分分析的性质
- 6.3 主成分分析步骤
- 6.4 主成分分析注意事项
- 案例6:地区电信业发展的主成分分析
- 思考与练习
- 第7章 因子分析及Python 应用
- 7.1 因子分析模型
- 7.2 因子载荷及解释
- 7.3 因子旋转
- 7.4 因子得分
- 7.5 因子分析步骤
- 7.6 实际中进行因子分析
- 案例7:上市公司经营业绩评价的因子分析
- 思考与练习
- 第8章 对应分析及Python 视图
- 8.1 对应分析的提出
- 8.2 对应分析基本原理
- 8.3 对应分析计算步骤
- 8.4 对应分析注意事项
- 案例8:对应分析在农民收入中的应用
- 思考与练习
- 下篇 多元数据的有监督机器学习
- 第9章 相关与回归及Python 分析
- 9.1 变量间的关系
- 9.2 一元相关与回归分析
- 9.3 多元相关与回归分析
- 案例9:中国宏观经济发展的多因素分析
- 思考与练习
- 第10章 典型相关分析及Python 应用
- 10.1 引言
- 10.2 相关分析的架构
- 10.3 典型相关分析原理
- 10.4 典型相关分析步骤
- 案例10:R&D 投入与产出的典型相关分析
- 思考与练习
- 第11章 扩展线性模型及Python 建模
- 11.1 数据分类与模型选择
- 11.2 方差分析模型
- 11.3 广义线性模型
- 案例11:服务产品观点的Logistic 回归模型
- 思考与练习
- 第12章 判别分析及Python 算法
- 12.1 判别分析的概念
- 12.2 Fisher 判别法
- 12.3 Bayes 判别法
- 案例12:企业财务状况的判别分析
- 思考与练习
- 附录 书中自定义函数及使用
- 参考文献