顶部
收藏

数据科学与工程算法基础


作者:
高明 胡卉芪
定价:
42.00元
ISBN:
978-7-04-055336-9
版面字数:
340.000千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2021-05-28
读者对象:
高等教育
一级分类:
计算机/教育技术类
二级分类:
计算机科学与技术专业课程

本书从概率统计、线性代数和组合优化角度出发, 介绍经典的数据科学与工程算法, 内容涉及数据分析处理全流程的算法及其数学基础, 主要包括抽样算法; 尾概率不等式及其应用; 典型的哈希技术, 如布隆过滤器和局部敏感哈希; 数据流模型以及典型 Misra Gries 算法、Count Sketch 算法; 随机游走及其应用; EM 算法; 特征值计算; 奇异值分解和主成分分析;矩阵分解; 整数规划; 子模函数及其应用; 模块度及社区发现等。全书配有大量翔实的应用实例可供参考, 有相当数量的习题可供读者练习。

本书可作为数据科学与大数据技术专业本科生、研究生相关课程的教材或参考书, 也可供相关领域技术人员参考。

  • 前辅文
  • 第1 章绪论
    • 1.1 数据分析处理阶段
      • 1.1.1 数据采集
      • 1.1.2 数据预处理
      • 1.1.3 数据存储与管理
      • 1.1.4 数据分析与挖掘
      • 1.1.5 数据可视化
    • 1.2 算法设计原则
      • 1.2.1 数据特点
      • 1.2.2 算法评价
      • 1.2.3 算法设计原则
    • 本章小结
    • 习题
  • 第2 章抽样算法
    • 2.1 引入
    • 2.2 基本概念
      • 2.2.1 总体与样本
      • 2.2.2 抽样调查
    • 2.3 系统抽样
      • 2.3.1 直线等距抽样
      • 2.3.2 圆形等距抽样
      • 2.3.3 系统抽样特点
    • 2.4 分层抽样
    • 2.5 水库抽样
      • 2.5.1 水库抽样算法
      • 2.5.2 算法分析
      • 2.5.3 分布式水库抽样算法
    • 本章小结
    • 习题
  • 第3 章尾概率不等式及其应用
    • 3.1 引入
    • 3.2 Markov 不等式
    • 3.3 Chebyshev 不等式
    • 3.4 Chernoff 不等式
    • 3.5 尾概率不等式的应用—— Morris 算法
      • 3.5.1 Morris 算法
      • 3.5.2 Morris+ 算法
      • 3.5.3 Morris++ 算法
    • 本章小结
    • 习题
  • 第4 章哈希技术
    • 4.1 引入
    • 4.2 哈希
    • 4.3 布隆过滤器
      • 4.3.1 布隆过滤器的基本原理
      • 4.3.2 误判率
      • 4.3.3 降低误判率
      • 4.3.4 应用场景
    • 4.4 局部敏感哈希
      • 4.4.1 哈希函数的选择
      • 4.4.2 Shingling
      • 4.4.3 Min-Hashing
      • 4.4.4 基于Min-Hashing的局部敏感哈希过程
      • 4.4.5 应用场景
    • 本章小结
    • 习题
  • 第5 章数据流模型及频繁项挖掘
    • 5.1 引入
    • 5.2 数据流模型
      • 5.2.1 数据流和数据流模型
      • 5.2.2 数据流子模型
      • 5.2.3 概要数据结构
      • 5.2.4 近似算法
    • 5.3 频繁项挖掘
    • 5.4 确定性近似频数算法Misra Gries
      • 5.4.1 Misra Gries 算法
      • 5.4.2 Misra Gries 算法分析
    • 5.5 随机近似频数算法Count Sketch
      • 5.5.1 简单抽样算法
      • 5.5.2 Basic Count Sketch算法
      • 5.5.3 Count Sketch 算法
      • 5.5.4 Count-Min Sketch算法
    • 本章小结
    • 习题
  • 第6 章EM 算法
    • 6.1 引入
    • 6.2 最大似然估计方法
      • 6.2.1 似然函数
      • 6.2.2 最大似然估计
      • 6.2.3 混合模型
    • 6.3 EM 算法
      • 6.3.1 算法推导
      • 6.3.2 EM 算法
      • 6.3.3 EM 算法的收敛性
    • 本章小结
    • 习题
  • 第7 章随机游走及其应用
    • 7.1 引入
    • 7.2 随机过程
      • 7.2.1 马尔可夫过程
      • 7.2.2 随机游走
      • 7.2.3 转移概率矩阵
      • 7.2.4 平稳分布
    • 7.3 PageRank
      • 7.3.1 PageRank 问题定义与基本假设
      • 7.3.2 PageRank 值的计算方法
      • 7.3.3 PageRank 算法的改进
      • 7.3.4 算法收敛性分析
    • 本章小结
    • 习题
  • 第8 章特征值计算
    • 8.1 算法引入
    • 8.2 方阵的特征值与特征向量
    • 8.3 幂法
      • 8.3.1 幂法
      • 8.3.2 幂法改进
    • 8.4 反幂法
    • 8.5 瑞利商迭代法
      • 8.5.1 瑞利商定义
      • 8.5.2 瑞利商迭代法
      • 8.5.3 降阶技术
    • 本章小结
    • 习题
  • 第9 章奇异值分解与主成分分析
    • 9.1 引入
    • 9.2 对角化与特征值分解
    • 9.3 奇异值分解
      • 9.3.1 奇异值
      • 9.3.2 奇异值分解
      • 9.3.3 奇异值分解的应用
    • 9.4 主成分分析
      • 9.4.1 协方差
      • 9.4.2 协方差矩阵
      • 9.4.3 主成分分析
      • 9.4.4 PCA 的应用
    • 本章小结
    • 习题
  • 第10 章矩阵分解
    • 10.1 引入
    • 10.2 问题定义
      • 10.2.1 损失函数
      • 10.2.2 代价函数
    • 10.3 梯度下降算法
      • 10.3.1 凸函数及其极小值
      • 10.3.2 梯度下降算法
      • 10.3.3 随机梯度下降算法
      • 10.3.4 小批量梯度下降算法
    • 10.4 基于梯度下降的矩阵分解
      • 10.4.1 矩阵分解算法
      • 10.4.2 正则化
      • 10.4.3 矩阵分解算法变体
      • 10.4.4 矩阵分解的应用
    • 10.5 非负矩阵分解
      • 10.5.1 非负矩阵分解算法
      • 10.5.2 非负矩阵分解的应用
    • 本章小结
    • 习题10
  • 第11 章整数规划
    • 11.1 引入
    • 11.2 整数规划
      • 11.2.1 表示约束
      • 11.2.2 可行域
    • 11.3 分支定界法
      • 11.3.1 枚举树
      • 11.3.2 松弛和定界
      • 11.3.3 分支定界算法
      • 11.3.4 分支定界算法的例子
    • 11.4 割平面法
      • 11.4.1 有效不等式
      • 11.4.2 割平面法
    • 本章小结
    • 习题11
  • 第12 章子模函数及其应用
    • 12.1 引入
    • 12.2 子模函数及其性质
      • 12.2.1 子模函数
      • 12.2.2 子模函数的性质
    • 12.3 集合覆盖
      • 12.3.1 问题定义
      • 12.3.2 抽取式文本摘要
      • 12.3.3 集合覆盖问题满足子模条件
    • 12.4 爬山算法
    • 本章小结
    • 习题12
  • 第13 章模块度及社区发现
    • 13.1 引入
    • 13.2 图模型
      • 13.2.1 随机图
      • 13.2.2 NULL 模型
      • 13.2.3 无标度图
    • 13.3 模块度
      • 13.3.1 模块度的定义
      • 13.3.2 模块度的计算性质
      • 13.3.3 权重图的模块度定义
      • 13.3.4 有向图的模块度定义
      • 13.3.5 模块度的矩阵定义
    • 13.4 社区发现
      • 13.4.1 谱方法
      • 13.4.2 Louvain 算法
    • 本章小结
    • 习题13
  • 参考文献

“数据科学与工程算法基础”数字课程与纸质教材紧密配合,为读者提供教学视频、电子教案等教学资源,丰富知识的呈现形式,拓展教材的内容,为读者自主学习提供思维与探索的空间,有效帮助读者提升课程学习的效果。
 

相关图书