顶部
收藏

大数据管理(第2版)


作者:
主编 杜小勇 卢卫 副主编 柴云鹏 陈红 李翠平 张峰 张孝
定价:
40.00元
ISBN:
978-7-04-063681-9
版面字数:
340.00千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2025-10-23
物料号:
63681-00
读者对象:
高等教育
一级分类:
计算机/教育技术类
二级分类:
计算机科学与技术专业课程

本书是大数据新兴领域“十四五”高等教育教材。本书系统、全面地阐述了大数据管理的基本概念、技术和方法。全书分为三篇,共9章。第一篇为数据管理系统,包含第1章,综述了数据管理系统发展所经历的四个阶段,以及大数据管理系统的数据特征和系统特征,阐述了大数据管理系统的组成,指出大数据管理系统完成了从NoSQL到NewSQL的过渡。第二篇为NoSQL数据库,包含第2~4章,阐述了键值数据库、文档数据库、图数据库的相关知识。第三篇为NewSQL数据库,包含第5~9章,阐述了NewSQL数据库的基本知识,以及分布式数据存储、分布式查询处理与优化、分布式事务处理、分布式数据库的高可用技术的相关知识。

本书既可作为高等学校大数据相关专业、计算机类专业、信息管理与信息系统等专业大数据管理课程的教材,也可供从事数据库和大数据管理系统研究、开发和应用的研究人员和工程技术人员参考。

  • 前辅文
  • 第一篇 数据管理系统
    • 第1章 数据管理系统概述
      • 1.1 数据管理系统的发展历史
        • 1.1.1 第一代:层次、网状数据库系统
        • 1.1.2 第二代:关系数据库系统
        • 1.1.3 第三代:数据仓库系统
        • 1.1.4 第四代:大数据管理系统
        • 1.1.5 小结
      • 1.2 大数据管理系统的特征
        • 1.2.1 大数据管理系统的数据特征
        • 1.2.2 大数据管理系统的系统特征
      • 1.3 大数据管理系统的组成
        • 1.3.1 多引擎系统结构
        • 1.3.2 混合负载系统架构
        • 1.3.3 分布式系统架构
      • 1.4 本章小结
      • 习题
  • 第二篇 NoSQL数据库
    • 第2章 键值数据库
      • 2.1 键值数据库概述
      • 2.2 键值数据库的数据模型
        • 2.2.1 键值对模型
        • 2.2.2 列族模型
      • 2.3 键值数据库应用实践
        • 2.3.1 排行榜常用操作
        • 2.3.2 排行榜应用实例
      • 2.4 本章小结
      • 习题
    • 第3章 文档模型与查询语言
      • 3.1 文档数据库概述
      • 3.2 文档结构
        • 3.2.1 XML结构
        • 3.2.2 JSON结构
      • 3.3 查询语言
        • 3.3.1 DOM接口
        • 3.3.2 XQuery
        • 3.3.3 FLWOR
        • 3.3.4 XPath
        • 3.3.5 JSON API
      • 3.4 MongoDB应用实践
        • 3.4.1 MongoDB文档数据库系统
        • 3.4.2 应用案例—芒果点餐
      • 3.5 本章小结
      • 习题
    • 第4章 图数据库
      • 4.1 图数据库概述
        • 4.1.1 图数据库的基本概念
        • 4.1.2 图数据库的发展历史
        • 4.1.3 图数据库的特点
        • 4.1.4 图数据库的应用场景
      • 4.2 图数据结构
        • 4.2.1 简单图
        • 4.2.2 标签图
        • 4.2.3 属性图
      • 4.3 图数据操作
        • 4.3.1 图匹配
        • 4.3.2 图导航
        • 4.3.3 图与关系的复合操作
      • 4.4 图查询语言Cypher
        • 4.4.1 对象创建
        • 4.4.2 检索
        • 4.4.3 图的更新
      • 4.5 图数据库应用实践
        • 4.5.1 Neo4j简介
        • 4.5.2 Neo4j应用案例
      • 4.6 本章小结
      • 习题
  • 第三篇 NewSQL数据库
    • 第5章 NewSQL数据库
      • 5.1 系统特征
      • 5.2 系统架构
      • 5.3 系统组成
        • 5.3.1 分布式存储引擎
        • 5.3.2 事务处理器
        • 5.3.3 SQL查询处理器
        • 5.3.4 缓存与内存管理
        • 5.3.5 网络通信层
        • 5.3.6 系统监控与管理
        • 5.3.7 小结
      • 5.4 运行时实例
        • 5.4.1 Spanner系统架构
        • 5.4.2 Spanner分布式存储引擎
        • 5.4.3 Spanner事务处理器
        • 5.4.4 Spanner SQL查询处理器
      • 5.5 本章小结
      • 习题
    • 第6章 分布式数据存储
      • 6.1 概述
      • 6.2 索引技术
        • 6.2.1 哈希索引
        • 6.2.2 有序索引
        • 6.2.3 哈希-有序复合索引
        • 6.2.4 辅助索引
        • 6.2.5 其他索引技术
      • 6.3 键值存储
        • 6.3.1 基于哈希索引的键值存储系统
        • 6.3.2 基于LSM树索引的键值存储系统
        • 6.3.3 基于B/B+树索引的键值存储系统
      • 6.4 其他数据模型存储
        • 6.4.1 列存储模型
        • 6.4.2 列存储数据库
        • 6.4.3 HDFS列存储
        • 6.4.4 图存储
      • 6.5 分布式存储技术
        • 6.5.1 数据分片
        • 6.5.2 数据路由
      • 6.6 本章小结
      • 习题
    • 第7章 分布式查询处理与优化
      • 7.1 分布式查询处理概述
      • 7.2 查询检查
      • 7.3 全局逻辑查询优化
        • 7.3.1 查询规范化
        • 7.3.2 查询分析
        • 7.3.3 消除冗余
        • 7.3.4 查询重写
      • 7.4 查询分解
      • 7.5 分布式查询优化
        • 7.5.1 代价模型
        • 7.5.2 连接操作的优化
        • 7.5.3 分布式查询计划的搜索策略
      • 7.6 分布式查询执行
      • 7.7 本章小结
      • 习题
    • 第8章 分布式事务处理
      • 8.1 分布式事务处理概述
        • 8.1.1 事务的基本概念
        • 8.1.2 事务并发执行的正确性理论
        • 8.1.3 两阶段封锁协议
      • 8.2 分布式事务处理技术
        • 8.2.1 分布式事务执行
        • 8.2.2 分布式事务提交
        • 8.2.3 确定性事务处理
      • 8.3 多协调器架构下的分布式事务处理
        • 8.3.1 多协调器架构下数据一致性问题
        • 8.3.2 多协调器架构下分布式事务处理技术
      • 8.4 本章小结
      • 习题
    • 第9章 分布式数据库的高可用技术
      • 9.1 高可用技术的基本概念
        • 9.1.1 高可用
        • 9.1.2 故障分类
      • 9.2 基于复制的数据高可用技术
        • 9.2.1 数据复制技术概述
        • 9.2.2 基于单主复制的数据高可用
        • 9.2.3 基于无主复制的数据高可用
        • 9.2.4 基于Paxos和Raft协议的数据高可用
      • 9.3 事务处理的高可用技术
        • 9.3.1 主流高可用的分布式事务处理机制
        • 9.3.2 节点故障时事务的高可用
      • 9.4 本章小结
      • 习题
  • 参考文献

相关图书