顶部
收藏

数据科学的数据基础(上册)


作者:
徐颂华 徐晨 编著
定价:
58.00元
ISBN:
978-7-04-064646-7
版面字数:
510.00千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2025-10-17
物料号:
64646-00
读者对象:
高等教育
一级分类:
数学与统计学类
二级分类:
信息与计算科学专业课
三级分类:
数据分析

本书以数据智能技术为核心,深入剖析了其在全球数据爆炸性增长背景下的应用与发展。全书分上、下两册,上册包含第一至五部分,下册包含第六至九部分,内容涵盖自然语言文字、图像、视频、音频、时间序列、时空、社交网络、生物信息学及多模态等9大关键领域数据的分析与处理。全书系统回顾了每个领域中的基础理论、关键技术进展及其实际应用案例,理论与实践紧密结合,条理清晰,并提供丰富的习题和参考文献供读者巩固学习及拓展进阶,无论是专业人士深入研究,还是初学者了解前沿,都极具参考价值。

本书可作为高等学校数据科学专业高年级本科生或研究生教材,也可供从事人工智能、机器学习、图像和信号处理等领域的科技工作者参考。

  • 前辅文
  • 第一部分 自然语言文字数据的分析与处理
    • 第一章 自然语言文字数据的表示
      • 1.1 基于词袋模型的自然语言表示
        • 1.1.1 词袋模型的定义
        • 1.1.2 基于词袋模型的自然语言表示
      • 1.2 基于N元模型的自然语言表示
        • 1.2.1 基于N元模型的语言建模及其混淆度
        • 1.2.2 基于加一操作的平滑方法
        • 1.2.3 基于打折的平滑方法
        • 1.2.4 基于Good-Turing频率估计的平滑方法
        • 1.2.5 基于插值的平滑方法和Jelinek-Mercer平滑方法
        • 1.2.6 基于Katz回退的平滑方法
        • 1.2.7 N元模型用于自然语言表示的局限性
      • 1.3 基于正则文法的自然语言表达
        • 1.3.1 正则文法的定义
        • 1.3.2 基于正则表达式的自然语言表达
      • 1.4 基于上下文无关文法的自然语言表达
        • 1.4.1 上下文无关文法的基本概念
        • 1.4.2 基于上下文无关文法的自然语言生成
        • 1.4.3 乔姆斯基范式与上下文无关文法
      • 1.5 基于带有概率分布的上下文无关文法的自然语言表达
        • 1.5.1 基于带有概率分布的上下文无关文法的定义
        • 1.5.2 基于带有概率分布的上下文无关文法的自然语言表达
        • 1.5.3 基于带有概率分布的上下文无关文法中产生式规则的概率估计
      • 1.6 基于嵌人表达的自然语言表示
        • 1.6.1 基于连续词袋模型的单词嵌人表达方法
        • 1.6.2 基于连续跳跃词元模型的单词嵌入表达方法
        • 1.6.3 基于负采样思想的单词嵌入表达方法
        • 1.6.4 层次化的softmax方法
        • 1.6.5 基于全局向量GloVe的单词嵌入表达方法
        • 1.6.6 对于词组的嵌入表达方法
        • 1.6.7 对于句子的嵌入表达方法
      • 1.7 基于命题逻辑的自然语言表达
        • 1.7.1 命题逻辑的研究内容
        • 1.7.2 基于命题逻辑的自然语言表达
        • 1.7.3 关于命题逻辑真伪性论证的逻辑演算规则
      • 1.8 基于一阶逻辑的自然语言表达
        • 1.8.1 一阶逻辑的谓词与量词
        • 1.8.2 一阶逻辑的主要概念
      • 1.9 基于入代数的自然语言表达
        • 1.9.1 λ代数的基本概念
        • 1.9.2 基于λ代数的自然语言表达
      • 习题一
    • 第二章 自然语言文字处理的典型问题
      • 2.1 自然语言序列的标签识别与生成
      • 2.2 主题提取
      • 2.3 指代消解
      • 2.4 命名实体识别
      • 2.5 机器翻译
      • 2.6 自动文本摘要
      • 2.7 关系抽取
      • 习题二
    • 第三章 自然语言文字处理的主要方法
      • 3.1 标签识别与生成方法
        • 3.1.1 基于Viterbi算法的自然语言序列的标签识别与生成
        • 3.1.2 面向上下文无关文法解析的CYK算法
        • 3.1.3 面向带有概率分布的上下文无关文法解析的Inside-Outside算法
        • 3.1.4 基于神经网络模型的自然语言序列的标签识别与生成
      • 3.2 主题的提取方法
        • 3.2.1 基于隐含语义分析的自然语言主题模型
        • 3.2.2 基于概率隐含语义分析的自然语言主题模型
        • 3.2.3 基于潜在狄利克雷分布的自然语言主题模型
      • 3.3 指代消解方法
        • 3.3.1 描述检测算法
        • 3.3.2 共指消解算法
      • 3.4 命名实体识别方法
        • 3.4.1 基于条件随机场算法的命名实体识别
        • 3.4.2 基于Bi-LSTM-CRF模型的命名实体识别
      • 3.5 机器翻译方法
        • 3.5.1 统计机器翻译
        • 3.5.2 神经机器翻译
      • 3.6 自动文本摘要方法
        • 3.6.1 抽取式摘要方法
        • 3.6.2 生成式摘要方法
      • 3.7 关系抽取方法
        • 3.7.1 基于自助法的半监督关系抽取
        • 3.7.2 基于ReVerb的无监督关系抽取
      • 3.8 自然语言文字处理的发展前沿
      • 习题三
  • 第二部分 图像数据的分析与处理
    • 第四章 图像数据的表示
      • 4.1 位图图像与矢量图像表示
      • 4.2 色彩模型与色彩空间的表示
        • 4.2.1 加性色彩模型与RGB模型
        • 4.2.2 减性色彩模型与CMY模型
        • 4.2.3 CIE XYZ色彩空间
      • 4.3 数字图像的类型
      • 习题四
    • 第五章 图像数据处理的典型问题
      • 5.1 图像分类
      • 5.2 图像检测
      • 5.3 图像语义分割
        • 5.3.1 基于分布的损失函数
        • 5.3.2 基于区域的损失雨数
        • 5.3.3 基于边界的损失函数
        • 5.3.4 基于复合的损失函数
      • 5.4 图像生成
      • 5.5 人脸识别
      • 5.6 图像情感识别
      • 5.7 图像恢复
      • 5.8 图像增强
      • 5.9 图像超分辨率
      • 5.10 图像数据文献综述
      • 习题五
    • 第六章 图像数据处理的主要方法
      • 6.1 图像分类方法
        • 6.1.1 传统的图像分类方法
        • 6.1.2 基于深度学习的图像分类方法
        • 6.1.3 基于CNN的图像分类算法
      • 6.2 图像检测方法
        • 6.2.1 传统的图像目标检测方法
        • 6.2.2 基于深度学习的图像目标检测方法
      • 6.3 图像语义分割方法
        • 6.3.1 传统的图像语义分割方法
        • 6.3.2 基于深度学习的图像语义分割方法
      • 6.4 人脸识别方法
        • 6.4.1 基于几何识别方法
        • 6.4.2 基于神经网络识别方法
        • 6.4.3 基于3D的人脸识别方法
      • 6.5 图像情感识别方法
        • 6.5.1 基于单一深度语义特征的图像情感识别算法
        • 6.5.2 基于深度语义特征的图像情感分类算法
      • 6.6 图像数据的发展前沿
      • 习题六
  • 第三部分 视频数据的分析与处理
    • 第七章 视频数据的表示
      • 7.1 视频数据的基本概念
      • 7.2 视频信息的特点
      • 7.3 视频数据的表示
      • 7.4 视频数据的特点
      • 7.5 视频数据的格式
      • 习题七
    • 第八章 视频数据的典型问题
      • 8.1 视频压缩
      • 8.2 视频分类
      • 8.3 视频目标检测
      • 8.4 视频目标跟踪
      • 8.5 视频分割
      • 习题八
    • 第九章 视频数据处理的主要方法
      • 9.1 视频数据的预处理
      • 9.2 视频压缩方法
        • 9.2.1 帧内压缩、运动JPEG 2000和数字电影
        • 9.2.2 3D变换编码
        • 9.2.3 运动补偿变换编码
      • 9.3 视频分类方法
        • 9.3.1 传统视频分类方法
        • 9.3.2 基于深度学习的视频分类方法
      • 9.4 视频运动目标检测
        • 9.4.1 帧差法
        • 9.4.2 光流法
        • 9.4.3 背景差法
        • 9.4.4 流引导特征融合法
      • 9.5 视频分割与跟踪方法
        • 9.5.1 图像分割
        • 9.5.2 变化检测
        • 9.5.3 运动分割
        • 9.5.4 运动跟踪
      • 9.6 视频数据处理的发展前沿
      • 习题九
  • 第四部分 音频数据的分析与处理
    • 第十章 音频数据的表示
      • 10.1 音频的构成要素
      • 10.2 数字音频基础
      • 10.3 音频数据格式和结构
      • 10.4 音频数据的表示
      • 习题十
    • 第十一章 音频数据处理的典型问题
      • 11.1 音频预处理
      • 11.2 音频压缩
      • 11.3 语音识别
      • 11.4 语音合成
      • 11.5 音频指纹识别
      • 11.6 语音增强
      • 11.7 音乐推荐
      • 习题十一
    • 第十二章 音频数据处理的主要方法
      • 12.1 音频分类方法
        • 12.1.1 音频特征分析
        • 12.1.2 最小距离法
        • 12.1.3 支持向量机
      • 12.2 语音编码
        • 12.2.1 线性预测
        • 12.2.2 合成分析法
        • 12.2.3 感知加权滤波器
      • 12.3 语音合成方法
        • 12.3.1 线性预测合成法
        • 12.3.2 基音同步叠加算法
        • 12.3.3 WaveRNN算法
      • 12.4 语音识别方法
        • 12.4.1 基于隐马尔可夫模型
        • 12.4.2 基于动态时间规整算法
      • 12.5 语音情感识别方法
        • 12.5.1 主成分分析法
        • 12.5.2 神经网络方法
        • 12.5.3 高斯混合模型法
      • 12.6 音频数据处理的发展前沿
      • 习题十二
  • 第五部分 时间序列数据的分析与处理
    • 第十三章 时间序列数据的表示
      • 13.1 时间序列数据的表示
      • 13.2 时间序列的类型
      • 13.3 时间序列的特征
      • 13.4 时间序列的基本知识
      • 13.5 时间序列建模策略
      • 习题十三
    • 第十四章 时间序列数据处理的主要问题
      • 14.1 预测
      • 14.2 分类
      • 14.3 时间序列聚类
      • 14.4 异常检测
      • 14.5 语义感知
      • 习题十四
    • 第十五章 时间序列数据处理的主要方法
      • 15.1 预处理
      • 15.2 常用预测方法
        • 15.2.1 传统方法
        • 15.2.2 机器学习方法
        • 15.2.3 混合模型
      • 15.3 分类方法
        • 15.3.1 基于全系列相似性的分类
        • 15.3.2 基于区间的分类
        • 15.3.3 基于shapelets的分类
        • 15.3.4 基于词典的分类
        • 15.3.5 基于模型的分类
        • 15.3.6 混合方法
      • 15.4 聚类方法
        • 15.4.1 相似性度量方法
        • 15.4.2 基于距离的聚类方法
        • 15.4.3 基于相似性的聚类方法
      • 15.5 异常检测方法
        • 15.5.1 基于传统方法的异常检测
        • 15.5.2 基于机器学习的异常检测
      • 15.6 语义感知方法
        • 15.6.1 模式识别
        • 15.6.2 模糊认知图
        • 15.6.3 早期分类
      • 15.7 时间序列数据处理的发展前沿
      • 习题十五
  • 参考文献

相关图书