顶部
收藏

数据科学前沿技术导论


作者:
高云君 陈璐 苗晓晔 张天明
定价:
65.00元
ISBN:
978-7-04-061906-5
版面字数:
620.00千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2024-12-20
物料号:
61906-00
读者对象:
高等教育
一级分类:
计算机/教育技术类
二级分类:
计算机类专业核心课程
三级分类:
人工智能

本书是“新一代人工智能系列教材”之一,全面、详细地介绍数据科学的基本问题、前沿技术及应用系统。

本书共分为11章。第1章概述数据科学,介绍数据科学的现有技术与工具;第2章介绍数据治理,包括实体对齐、数据融合和数据清洗;第3章介绍数据定价,包括数据定价机制和模型定价机制;第4章至第7章介绍面向不同数据类型(地理空间数据、度量空间数据、缺失数据和图数据)的管理技术,数据管理旨在根据不同的数据特征,进行建模、存储、索引和查询,服务上层应用;第8章介绍数据查询结果可用性分析技术,旨在通过可用性分析提供用户与查询之间的交互,提升查询结果质量;第9章和第10章介绍数据库技术和人工智能技术的融合,包括数据库支持的AI(DB4AI)技术和AI赋能的数据库(AI4DB)技术,旨在通过两者的融合实现大数据智能,以高效智能地处理大数据;第11章介绍新型数据库管理系统。

本书适合作为高等学校人工智能、大数据等专业本科生、研究生的教材或教学参考书,也可供相关领域的科研人员、工程技术人员和管理人员参考阅读。

  • 前辅文
  • 第1章 引言
    • 1.1 数据科学概述
      • 1.1.1 大数据的内涵与特征
      • 1.1.2 数据科学的发展历史
      • 1.1.3 数据科学的定义
    • 1.2 数据预处理
      • 1.2.1 数据质量
      • 1.2.2 数据转换
      • 1.2.3 数据归约
      • 1.2.4 数据清洗
      • 1.2.5 数据集成
    • 1.3 数据计算
      • 1.3.1 计算模式的发展
      • 1.3.2 云计算
    • 1.4 数据管理
      • 1.4.1 传统数据管理技术与系统
      • 1.4.2 新型数据管理技术与系统
    • 1.5 技术与工具
    • 1.6 本书内容组织
    • 1.7 本章小结
    • 参考文献
  • 第2章 数据治理
    • 2.1 数据治理概述
      • 2.1.1 基本概念
      • 2.1.2 典型应用
    • 2.2 实体解析
      • 2.2.1 实体解析概述
      • 2.2.2 关系数据实体解析
      • 2.2.3 图数据实体解析
    • 2.3 数据融合
      • 2.3.1 数据融合概述
      • 2.3.2 关系数据融合
      • 2.3.3 知识融合
    • 2.4 数据清洗
      • 2.4.1 数据清洗概述
      • 2.4.2 关系数据清洗
      • 2.4.3 图数据清洗
    • 2.5 小结与展望
    • 2.6 术语表
    • 2.7 习题
    • 参考文献
  • 第3章 数据定价
    • 3.1 数据定价概述
    • 3.2 数据定价机制
      • 3.2.1 数据定价机制概述
      • 3.2.2 基于数据特性定价
      • 3.2.3 基于价格推断定价
      • 3.2.4 基于数据效用定价
    • 3.3 模型定价机制
      • 3.3.1 基本概念
      • 3.3.2 基于模型精度定价
      • 3.3.3 基于差分隐私定价
      • 3.3.4 训练数据激励机制
    • 3.4 小结与展望
    • 3.5 术语表
    • 3.6 习题
    • 参考文献
  • 第4章 地理空间数据管理
    • 4.1 地理空间数据管理概述
      • 4.1.1 空间数据管理基本概念
      • 4.1.2 轨迹数据管理基本概念
    • 4.2 空间数据管理
      • 4.2.1 空间数据索引
      • 4.2.2 空间数据区域查询
      • 4.2.3 空间数据k最近邻查询
      • 4.2.4 空间数据Skyline查询
      • 4.2.5 空间数据连接查询
    • 4.3 轨迹数据管理
      • 4.3.1 轨迹数据压缩
      • 4.3.2 轨迹数据度量
      • 4.3.3 轨迹数据索引
      • 4.3.4 轨迹数据查询
    • 4.4 小结与展望
    • 4.5 术语表
    • 4.6 习题
    • 参考文献
  • 第5章 度量空间数据管理
    • 5.1 度量空间数据管理概述
      • 5.1.1 基本概念
      • 5.1.2 典型度量空间
    • 5.2 度量空间数据索引
      • 5.2.1 基于支枢点的度量空间数据索引
      • 5.2.2 基于划分的度量空间数据索引
      • 5.2.3 混合索引
    • 5.3 度量空间数据查询
      • 5.3.1 度量相似性查询
      • 5.3.2 度量相似连接
      • 5.3.3 度量Skyline查询
    • 5.4 小结与展望
    • 5.5 术语表
    • 5.6 习题
    • 参考文献
  • 第6章 缺失数据管理
    • 6.1 缺失数据管理概述
      • 6.1.1 基本概念
      • 6.1.2 缺失数据表达
    • 6.2 缺失数据补全
      • 6.2.1 缺失数据补全方法分类
      • 6.2.2 基于统计技术的补全方法
      • 6.2.3 基于机器学习的补全方法
      • 6.2.4 基于深度学习的补全方法
    • 6.3 缺失数据索引
      • 6.3.1 位串增强索引
      • 6.3.2 MOSAIC索引
      • 6.3.3 位图索引
      • 6.3.4 向量近似索引
    • 6.4 缺失数据查询
      • 6.4.1 缺失数据相似性查询
      • 6.4.2 缺失数据Skyline查询
      • 6.4.3 缺失数据Top k支配查询
      • 6.4.4 缺失数据流排序查询
      • 6.4.5 基于众包的缺失数据查询
    • 6.5 小结与展望
    • 6.6 术语表
    • 6.7 习题
    • 参考文献
  • 第7章 图数据管理
    • 7.1 图数据管理概述
      • 7.1.1 基本概念
      • 7.1.2 典型应用
    • 7.2 图数据查询
      • 7.2.1 可达性查询
      • 7.2.2 相似性查询
      • 7.2.3 模式匹配
      • 7.2.4 社区搜索
    • 7.3 图数据挖掘
      • 7.3.1 社区发现
      • 7.3.2 图数据聚类
      • 7.3.3 图数据分类
      • 7.3.4 频繁子图挖掘
    • 7.4 小结和展望
    • 7.5 术语表
    • 7.6 习题
    • 参考文献
  • 第8章 数据查询结果可用性分析
    • 8.1 数据查询结果可用性分析概述
    • 8.2 Causality与Responsibility问题
      • 8.2.1 Causality与Responsibility问题定义
      • 8.2.2 基于CR的概率查询
    • 8.3 Why not与Why问题
      • 8.3.1 Why not与Why问题定义
      • 8.3.2 反Top k查询上的Why not问题
      • 8.3.3 反Top k查询上的Why问题
    • 8.4 Why few与Why many问题
      • 8.4.1 Why few与Why many问题定义
      • 8.4.2 Why few问题处理方法
      • 8.4.3 Why many问题处理方法
    • 8.5 小结与展望
    • 8.6 术语表
    • 8.7 习题
    • 参考文献
  • 第9章 数据库支持的AI技术
    • 9.1 DB4AI概述
    • 9.2 AI通用算子优化
      • 9.2.1 特征工程
      • 9.2.2 张量操作
      • 9.2.3 梯度下降
    • 9.3 模型管理技术
      • 9.3.1 源模型选择
      • 9.3.2 模型重用
      • 9.3.3 模型训练
    • 9.4 声明式AI系统
      • 9.4.1 程序设计语言
      • 9.4.2 编译优化
      • 9.4.3 异构环境部署
    • 9.5 小结与展望
    • 9.6 术语表
    • 9.7 习题
    • 参考文献
  • 第10章 AI赋能的数据库技术
    • 10.1 AI4DB概述
    • 10.2 AI赋能的数据处理
      • 10.2.1 学习型索引
      • 10.2.2 基数估计
      • 10.2.3 查询优化
    • 10.3 AI赋能的轨迹数据分析
      • 10.3.1 轨迹数据深度表征
      • 10.3.2 轨迹数据智能查询
      • 10.3.3 轨迹数据深度挖掘
    • 10.4 AI赋能的图数据分析
      • 10.4.1 图数据深度表征
      • 10.4.2 图数据智能查询
      • 10.4.3 图数据智能挖掘
    • 10.5 小结与展望
    • 10.6 术语表
    • 10.7 习题
    • 参考文献
  • 第11章 新型数据库管理系统
    • 11.1 数据库管理系统发展史
      • 11.1.1 数据库管理系统
      • 11.1.2 网状数据库管理系统
      • 11.1.3 层次数据库管理系统
      • 11.1.4 关系数据库管理系统
    • 11.2 空间数据库管理系统
      • 11.2.1 空间数据库系统特性
      • 11.2.2 PostGIS系统介绍
      • 11.2.3 PostGIS系统使用案例
    • 11.3 图数据库管理系统
      • 11.3.1 图数据库系统特性
      • 11.3.2 Neo4j数据库系统框架
      • 11.3.3 Neo4j数据库系统使用案例
    • 11.4 内存数据库管理系统
      • 11.4.1 内存数据库系统特性
      • 11.4.2 Redis数据库系统框架
      • 11.4.3 Redis数据库系统使用案例
    • 11.5 云原生数据库管理系统
      • 11.5.1 云原生数据库系统特性
      • 11.5.2 PolarDB数据库系统框架
      • 11.5.3 PolarDB数据库系统使用案例
    • 11.6 AI原生数据库管理系统
      • 11.6.1 AI原生数据库系统特性
      • 11.6.2 GaussDB数据库系统框架
      • 11.6.3 GaussDB数据库系统使用案例
    • 11.7 小结与展望
    • 11.8 术语表
    • 11.9 习题
    • 参考文献

相关图书