顶部
收藏

数据分析:方法与应用


作者:
刘宏志、吴中海
定价:
39.00元
ISBN:
978-7-04-059982-4
版面字数:
380.000千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2023-04-06
读者对象:
高等教育
一级分类:
计算机/教育技术类
二级分类:
软件工程专业课程

本书入选教育部高等学校软件工程专业教学指导委员会组织编写的“软件工程专业系列教材”。全书从基础的统计分析方法到基于机器学习的预测模型,全面系统地介绍了各种常用的数据分析方法及其典型应用,并结合大量实际应用案例介绍了各种分析方法的使用步骤及应用效果,让读者能够更好地了解各种分析方法的应用场景和价值。

全书共10章,包括:绪论、概论率基础、描述性分析、探索性分析、参数估计、假设检验、方差分析、相关分析与回归分析、机器学习、时间序列分析。附录给出了常用累积分布表和临界值表。

本书可作为高等学校计算机科学与技术、软件工程、数据科学与大数据技术、人工智能等专业高年级本科生和研究生“数据分析”“数学建模”“数据挖掘”等相关课程的教材,也可作为需要利用定量分析和数学建模进行业务分析和管理决策的相关工作人员的参考书。

  • 前辅文
  • 第1章绪论
    • 1.1 数据分析简介
      • 1.1.1 数据的定义与分类
      • 1.1.2 数据分析技术与方法
    • 1.2 数据分析流程
      • 1.2.1 问题定义与数据收集
      • 1.2.2 数据预处理
      • 1.2.3 描述性分析
      • 1.2.4 探索性分析
      • 1.2.5 推断性分析
      • 1.2.6 基于模型与算法的分析
      • 1.2.7 数据分析报告与应用
    • 1.3 应用案例
      • 1.3.1 电商数据分析
      • 1.3.2 交通数据分析
      • 1.3.3 文化传媒数据分析
      • 1.3.4 能源数据分析
      • 1.3.5 金融数据分析
    • 习题
  • 第2章 概率论基础
    • 2.1 概率的基本概念与性质
      • 2.1.1 随机事件与样本空间
      • 2.1.2 概率测度及其性质
    • 2.2 概率的计算
      • 2.2.1 等可能概型
      • 2.2.2 案例:辛普森悖论
      • 2.2.3 乘法原理与排列组合
      • 2.2.4 案例:生日悖论
      • 2.2.5 事件独立性
      • 2.2.6 案例:疾病感染率统计分析
    • 2.3 条件概率
      • 2.3.1 条件概率与全概率公式
      • 2.3.2 贝叶斯公式
      • 2.3.3 案例:测谎仪悖论
      • 2.3.4 案例:三门问题
    • 2.4 随机变量
      • 2.4.1 随机变量的定义与分类
      • 2.4.2 概率函数和累积分布函数
    • 2.5 数学期望
      • 2.5.1 期望的起源
      • 2.5.2 期望的定义
      • 2.5.3 案例:圣彼得堡悖论
      • 2.5.4 马尔可夫不等式
      • 2.5.5 联合分布函数的期望
    • 2.6 方差与协方差
      • 2.6.1 方差的定义与性质
      • 2.6.2 切比雪夫不等式
      • 2.6.3 案例:风险值的估算
      • 2.6.4 协方差与相关系数
      • 2.6.5 案例:投资组合风险分析
    • 2.7 常用概率分布
      • 2.7.1 离散型概率分布
      • 2.7.2 连续型概率分布
    • 习题
  • 第3章 描述性分析
    • 3.1 集中趋势分析
      • 3.1.1 算术平均数
      • 3.1.2 中位数
      • 3.1.3 四分位数
      • 3.1.4 众数
      • 3.1.5 算术平均数、中位数与众数的关系
    • 3.2 离中趋势分析
      • 3.2.1 极差
      • 3.2.2 平均差
      • 3.2.3 标准差
      • 3.2.4 四分位差
      • 3.2.5 异众比率
    • 3.3 分布形状分析
      • 3.3.1 偏度
      • 3.3.2 峰度
    • 习题
  • 第4章 探索性分析
    • 4.1 分析目标与方法分类
    • 4.2 单变量探索性分析
      • 4.2.1 直方图
      • 4.2.2 经验累积分布曲线与分位数图
      • 4.2.3 箱形图
      • 4.2.4 柱形图与饼形图
      • 4.2.5 案例:白葡萄酒品质分析
      • 4.2.6 时序图
      • 4.2.7 案例:航空公司乘客数量趋势分析
    • 4.3 双变量探索性分析
      • 4.3.1 散点图
      • 4.3.2 案例:车道探测器故障检测
      • 4.3.3 案例:地震空间分布分析
      • 4.3.4 晶格图与并排箱形图
      • 4.3.5 并列柱形图和堆叠柱形图
    • 4.4 多变量探索性分析
      • 4.4.1 成对散点图
      • 4.4.2 雷达图
      • 4.4.3 平行坐标图
    • 习题
  • 第5章 参数估计
    • 5.1 参数估计简介
    • 5.2 抽样调查
      • 5.2.1 抽样方法
      • 5.2.2 理论依据
      • 5.2.3 案例:上市公司市值分析
    • 5.3 点估计
      • 5.3.1 矩估计
      • 5.3.2 最大似然估计
      • 5.3.3 案例:湖中鱼的总数估计
      • 5.3.4 最大后验概率估计
    • 5.4 估计量的评价标准
      • 5.4.1 无偏性
      • 5.4.2 有效性
      • 5.4.3 一致性
      • 5.4.4 案例:德国坦克问题
    • 5.5 区间估计
    • 习题
  • 第6章 假设检验
    • 6.1 假设检验基础
      • 6.1.1 两类假设
      • 6.1.2 小概率原理
      • 6.1.3 两类错误
      • 6.1.4 三大抽样分布
      • 6.1.5 基本流程与方法分类
    • 6.2 参数检验
      • 6.2.1 检验统计量的构建
      • 6.2.2 统计决策:临界值法和p值法
    • 6.3 拟合优度检验
      • 6.3.1 卡方检验
      • 6.3.2 案例:遗传规律
      • 6.3.3 K-S检验
      • 6.3.4 J-B检验
      • 6.3.5 案例:顾客流量分析
    • 6.4 样本均值比较
      • 6.4.1 配对样本均值比较
      • 6.4.2 独立样本均值比较
      • 6.4.3 独立样本秩和检验
    • 习题
  • 第7章方差分析
    • 7.1 基本概念与基本思想
    • 7.2 单因素方差分析
      • 7.2.1 方差分解
      • 7.2.2 F检验
      • 7.2.3 关系强度测量
      • 7.2.4 多重比较
    • 7.3 多因素方差分析
      • 7.3.1 无交互作用的双因素方差分析
      • 7.3.2 案例:股票市盈率影响因素分析
      • 7.3.3 有交互作用的双因素方差分析
    • 7.4 秩方差分析
      • 7.4.1 K-W检验
      • 7.4.2 Nemenyi检验
      • 7.4.3 Friedman检验
      • 7.4.4 Bonferroni-Dunn检验
      • 7.4.5 案例:算法性能比较
    • 习题
  • 第8章相关分析与回归分析
    • 8.1 相关分析
      • 8.1.1 关系分类
      • 8.1.2 相关表与相关图
      • 8.1.3 皮尔逊相关系数
      • 8.1.4 秩相关系数
    • 8.2 回归分析
      • 8.2.1 回归分析的起源
      • 8.2.2 回归分析流程
      • 8.2.3 一元线性回归
      • 8.2.4 多元线性回归
      • 8.2.5 非线性回归
      • 8.2.6 案例:房价分析
    • 8.3 变量与模型选择
      • 8.3.1 评价准则
      • 8.3.2 选择方法
      • 8.3.3 案例:房价分析
    • 习题
  • 第9章机器学习
    • 9.1 引言
      • 9.1.1 什么是机器学习
      • 9.1.2 机器学习的应用场景
      • 9.1.3 机器学习的一般流程
    • 9.2 机器学习算法分类
    • 9.3 分类算法
      • 9.3.1 朴素贝叶斯算法
      • 9.3.2 逻辑斯谛回归算法
      • 9.3.3 决策树算法
      • 9.3.4 K近邻算法
      • 9.3.5 案例:入学申请结果预测
    • 9.4 聚类算法
      • 9.4.1 层次聚类算法
      • 9.4.2 K均值算法
      • 9.4.3 局部密度聚类算法
      • 9.4.4 案例:异常检测
    • 9.5 半监督学习算法
      • 9.5.1 模型假设
      • 9.5.2 E-M算法
      • 9.5.3 自训练模型
      • 9.5.4 协同训练模型
    • 习题
  • 第10章时间序列分析
    • 10.1 引言
      • 10.1.1 时间序列
      • 10.1.2 时间序列分析流程
    • 10.2 自回归模型
      • 10.2.1 移动平均法
      • 10.2.2 差分自回归移动平均模型
    • 10.3 案例:黄金价格预测
    • 10.4 因素分解模型
      • 10.4.1 时间序列因素分解
      • 10.4.2 Prophet模型
    • 10.5 案例:用户访问量预测
    • 10.6 基于循环神经网络的时间序列分析
      • 10.6.1 循环神经网络
      • 10.6.2 长短期记忆网络
      • 10.6.3 门控循环单元网络
    • 10.7 案例:股票价格预测
    • 习题
  • 附录 常用累积分布表和临界值表
    • 附录1 标准正态分布的累积分布表
    • 附录2 t检验的临界值表
    • 附录3 卡方检验的临界值表
    • 附录4 F检验的临界值表
    • 附录5 K-S检验的临界值表
    • 附录6 曼-惠特尼检验的临界值表
    • 附录7 K-W检验的临界值表
  • 参考文献

相关图书