顶部
收藏

统计学习(R语言版)


作者:
李高荣
定价:
89.00元
ISBN:
978-7-04-062518-9
版面字数:
880.000千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2024-09-23
读者对象:
高等教育
一级分类:
数学与统计学类
二级分类:
统计学专业课
三级分类:
其他课程

本书介绍了统计学习的思想、方法和理论以及R语言应用,涵盖的内容包括:绪论、模型评价、线性回归模型、重抽样方法、判别分析、K近邻法、模型选择与正则化、非参数回归模型、logistic回归、决策树、支持向量机、主成分分析、聚类分析、前馈神经网络和卷积神经网络等。

本书的主要特色是提供了大量翔实的应用案例,并使用R语言进行计算和数据可视化,对书中的统计学习方法和理论都给出了R语言程序和应用,并配有相当数量的习题可供练习。

本书取材新颖、阐述严谨、推导详尽、重点突出、深入浅出、富有启发性,便于教学与自学。

本书可作为统计学、数据科学、数学、计算机科学、人工智能、金融学、经济学、医学和工程领域等专业本科生和研究生的统计学习、机器学习和数据分析等课程的教材或参考书,也可供从事数据分析的相关科技人员和工作者参考。

  • 前辅文
  • 第1章 绪论
    • §1.1 统计学习概述
      • 1.1.1 统计学习的特点
      • 1.1.2 统计学习的对象
      • 1.1.3 统计学习的分类
    • §1.2 关于本书
    • §1.3 本书适用对象
    • 习题1
  • 第2章 模型评价
    • §2.1 回归模型及评价准则
      • 2.1.1 回归模型
      • 2.1.2 模型估计
      • 2.1.3 回归模型精度的评价准则
    • §2.2 分类模型及评价准则
    • 习题2
  • 第3章 线性回归模型
    • §3.1 线性回归模型
      • 3.1.1 模型介绍
      • 3.1.2 最小二乘估计
      • 3.1.3 σ2的估计
      • 3.1.4 假设检验
      • 3.1.5 预测区间与置信区间
      • 3.1.6 R语言函数及应用
    • §3.2 回归诊断
      • 3.2.1 什么是回归诊断?
      • 3.2.2 残差
      • 3.2.3 残差图
      • 3.2.4 影响分析
      • 3.2.5 多重共线性
    • §3.3 加权最小二乘方法
    • §3.4 Box-Cox变换
    • §3.5 定性协变量建模
    • 习题3
  • 第4章 重抽样方法
    • §4.1 交叉验证法
      • 4.1.1 验证集方法
      • 4.1.2 LOOCV方法
      • 4.1.3 GCV方法
      • 4.1.4 k折CV方法
    • §4.2 Bootstrap方法
    • 习题4
  • 第5章 判别分析
    • §5.1 判别准则
      • 5.1.1 判别准则简介
      • 5.1.2 两个总体的情形
    • §5.2 两个多元正态分布的判别
      • 5.2.1 当Σ1=Σ2=Σ时, 正态总体的判别
      • 5.2.2 Fisher判别
      • 5.2.3 当Σ1≠Σ2, 正态总体的判别
      • 5.2.4 先验概率不存在的情形
      • 5.2.5 分类效果的评价
      • 5.2.6 案例及R语言计算
    • §5.3 多个总体的判别
      • 5.3.1 多个总体的判别方法
      • 5.3.2 多个多元正态分布的判别方法
      • 5.3.3 多个总体的Fisher判别方法
      • 5.3.4 多个总体的案例及R语言计算
    • 习题5
  • 第6章 K近邻法
    • §6.1 KNN分类
      • 6.1.1 KNN分类算法
      • 6.1.2 K值的选择和KNN分类应用
    • §6.2 KNN回归
      • 6.2.1 KNN回归算法
      • 6.2.2 KNN回归应用
    • §6.3 K近邻法的优缺点
    • 习题6
  • 第7章 模型选择与正则化
    • §7.1 子集选择
      • 7.1.1 最优子集选择
      • 7.1.2 逐步选择方法
      • 7.1.3 调整的判定系数R2
      • 7.1.4 Cp准则
      • 7.1.5 信息准则
      • 7.1.6 案例与R语言计算
    • §7.2 岭回归
    • §7.3 桥回归
    • §7.4 惩罚变量选择方法
      • 7.4.1 惩罚函数
      • 7.4.2 Lasso方法
      • 7.4.3 SCAD方法
      • 7.4.4 自适应Lasso
      • 7.4.5 弹性网方法
      • 7.4.6 案例分析与模拟研究
    • 习题7
  • 第8章 非参数回归模型
    • §8.1 多项式回归
      • 8.1.1 多项式回归拟合
      • 8.1.2 分段多项式回归拟合
    • §8.2 回归样条
      • 8.2.1 d阶回归样条
      • 8.2.2 线性样条
      • 8.2.3 三次样条
      • 8.2.4 自然三次样条
      • 8.2.5 节点个数和位置的选择
      • 8.2.6 案例分析与应用
    • §8.3 光滑样条
      • 8.3.1 光滑样条方法
      • 8.3.2 光滑参数λ的选取
      • 8.3.3 案例分析与应用
    • §8.4 局部非参数光滑方法
      • 8.4.1 N-W核光滑方法
      • 8.4.2 Gasser-Müller光滑方法
      • 8.4.3 局部多项式光滑方法
      • 8.4.4 案例分析与应用
    • §8.5 广义可加模型
    • §8.6 半参数回归模型
      • 8.6.1 部分线性模型
      • 8.6.2 单指标模型
      • 8.6.3 变系数模型
    • 习题8
  • 第9章 Logistic回归
    • §9.1 多元logistic回归
      • 9.1.1 多元logistic回归模型
      • 9.1.2 极大似然估计
      • 9.1.3 预测
    • §9.2 二分类模型的评估
    • §9.3 惩罚似然变量选择方法
    • §9.4 非参数logistic回归
    • §9.5 多项logistic回归
    • §9.6 分类方法比较
    • 习题9
  • 第10章 决策树
    • §10.1 决策树的基本原理
    • §10.2 回归树
      • 10.2.1 递归二叉分裂法
      • 10.2.2 代价复杂性剪枝
      • 10.2.3 回归树的R案例分析
    • §10.3 分类树
      • 10.3.1 信息增益
      • 10.3.2 基尼指数
      • 10.3.3 分类树的代价复杂性剪枝
      • 10.3.4 分类树的R案例分析
    • §10.4 装袋法和随机森林
      • 10.4.1 装袋法
      • 10.4.2 袋外误差
      • 10.4.3 随机森林
      • 10.4.4 变量重要性的度量
      • 10.4.5 偏依赖图
      • 10.4.6 回归问题的R案例分析
      • 10.4.7 分类问题的R案例分析
    • §10.5 提升法
      • 10.5.1 自适应提升法
      • 10.5.2 AdaBoost算法应用
      • 10.5.3 回归问题的提升法
      • 10.5.4 程序包gbm的应用
    • 习题10
  • 第11章 支持向量机
    • §11.1 最大间隔分类器
      • 11.1.1 超平面
      • 11.1.2 分割超平面
      • 11.1.3 最大间隔分类器
    • §11.2 支持向量分类器
    • §11.3 支持向量机和核
    • §11.4 多分类的支持向量机
      • 11.4.1 一类对一类的分类方法
      • 11.4.2 一类对余类的分类方法
    • §11.5 惩罚支持向量机
    • §11.6 支持向量回归
    • §11.7 支持向量机的案例与R语言计算
      • 11.7.1 SVM的模拟数据分析与R语言计算
      • 11.7.2 SVM的二分类R案例
      • 11.7.3 SVM的多分类R案例
      • 11.7.4 SVR的R案例
    • 习题11
  • 第12章 主成分分析
    • §12.1 总体主成分分析
      • 12.1.1 主成分的定义与导出
      • 12.1.2 主成分的计算
      • 12.1.3 基于标准化的主成分
    • §12.2 样本主成分分析
      • 12.2.1 基于样本协方差矩阵S的主成分
      • 12.2.2 标准化的样本主成分
    • §12.3 主成分分析方法的应用
      • 12.3.1 主成分分析的R函数
      • 12.3.2 中学生身体指标数据主成分分析
      • 12.3.3 Fisher Iris数据主成分分析的可视化
      • 12.3.4 图像压缩
      • 12.3.5 人脸识别
    • §12.4 核主成分分析
    • 习题12
  • 第13章 聚类分析
    • §13.1 距离和相似系数
      • 13.1.1 数据预处理
      • 13.1.2 样本间的距离
      • 13.1.3 相似系数
      • 13.1.4 定性变量样本的距离和相似系数
      • 13.1.5 定性变量间的相似系数
    • §13.2 K均值聚类
      • 13.2.1 K均值聚类算法
      • 13.2.2 K均值聚类中类个数的确定和应用
      • 13.2.3 图像色彩的K均值聚类
    • §13.3 系统聚类法
      • 13.3.1 类间距离和系统聚类法
      • 13.3.2 系统聚类法的统一
      • 13.3.3 系统聚类法的性质和类的确定
      • 13.3.4 系统聚类的R语言计算与应用
      • 13.3.5 新的聚类方法
    • 习题13
  • 第14章 前馈神经网络
    • §14.1 神经元模型
      • 14.1.1 神经元
      • 14.1.2 激活函数
    • §14.2 前馈神经网络模型
      • 14.2.1 网络结构
      • 14.2.2 前馈神经网络模型及表示
      • 14.2.3 通用近似定理
      • 14.2.4 应用到机器学习
    • §14.3 反向传播算法
      • 14.3.1 参数学习
      • 14.3.2 BP算法
    • §14.4 前馈神经网络的正则化
    • §14.5 R案例分析与应用
      • 14.5.1 回归问题的R案例
      • 14.5.2 分类问题的R案例
    • 习题14
  • 第15章 卷积神经网络
    • §15.1 卷积
      • 15.1.1 数学卷积
      • 15.1.2 一维卷积
      • 15.1.3 二维卷积
      • 15.1.4 互相关
      • 15.1.5 填充和步长
      • 15.1.6 三维卷积
    • §15.2 汇聚
      • 15.2.1 二维汇聚
      • 15.2.2 三维汇聚
    • §15.3 卷积神经网络模型
      • 15.3.1 模型的定义
      • 15.3.2 卷积神经网络的性质
    • §15.4 卷积神经网络的学习算法
      • 15.4.1 卷积导数
      • 15.4.2 反向传播算法
    • §15.5 R案例分析与应用
      • 15.5.1 二分类的R案例分析
      • 15.5.2 多分类的R案例分析
    • 习题15
  • 参考文献
  • 索引

相关图书