顶部
收藏

数据仓库与数据分析教程(第2版)

“十二五”普通高等教育本科国家级规划教材

作者:
李翠平 王珊 李盛恩
定价:
38.00元
ISBN:
978-7-04-054851-8
版面字数:
420.000千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
“十二五”普通高等教育本科国家级规划教材
出版时间:
2021-01-15
读者对象:
高等教育
一级分类:
计算机/教育技术类
二级分类:
计算机类专业核心课程
三级分类:
数据库系统原理

数据仓库和数据分析技术是信息领域的核心技术之一,是基于海量数据的决策支持系统体系化环境的核心。

本书详尽地介绍了数据仓库与数据分析技术的基本概念和基本原理、建立数据仓库和进行数据分析的方法及过程。全书分为数据仓库技术篇、联机分析处理技术篇、数据挖掘技术篇、大数据技术篇4部分,共12章。

本书可作为高校计算机、信息管理类专业本科生和研究生的教材,也可供企事业单位信息管理部门及行业应用人员参考使用。

  • 前辅文
  • 第1篇 数据仓库技术
    • 第1章 从数据库到数据仓库
      • 1.1 数据仓库产生的原因
        • 1.1.1 操作型数据处理
        • 1.1.2 分析型数据处理
        • 1.1.3 两种数据处理模式的差别
        • 1.1.4 数据库系统的局限性
      • 1.2 数据仓库的基本概念
        • 1.2.1 主题与面向主题
        • 1.2.2 数据仓库数据的其他3个特征
        • 1.2.3 数据仓库的功能
      • 1.3 数据仓库的体系结构
        • 1.3.1 体系结构
        • 1.3.2 数据集市
      • 小结
      • 习题1
    • 第2章 操作型数据存储
      • 2.1 什么是ODS
        • 2.1.1 ODS的定义及特点
        • 2.1.2 ODS的功能和实现机制
      • 2.2 DB~ODS~DW体系结构
        • 2.2.1 ODS与DW
        • 2.2.2 DB~ODS~DW三层体系结构
      • 小结
      • 习题2
    • 第3章 数据仓库中的数据及组织
      • 3.1 数据仓库中的数据组织
      • 3.2 数据仓库中数据的追加
      • 3.3 数据仓库中的元数据
        • 3.3.1 元数据的定义
        • 3.3.2 元数据的分类
        • 3.3.3 元数据管理的标准化
      • 小结
      • 习题3
  • 第2篇 联机分析处理技术
    • 第4章 概述及模型
      • 4.1 OLAP技术概述
      • 4.2 多维数据模型
        • 4.2.1 基本概念
        • 4.2.2 星形模型、雪片模型和事实群模型
      • 4.3 多维分析操作
        • 4.3.1 多维分析的基础:聚集
        • 4.3.2 常用的多维分析操作
        • 4.3.3 其他多维分析操作
        • 4.3.4 聚集的一些限制
        • 4.3.5 水平层次结构和非水平层次结构
      • 4.4 多维查询语言
        • 4.4.1 MDX简介
        • 4.4.2 MDX对象模型
      • 4.5 多维数据展示
      • 小结
      • 习题4
    • 第5章 数据方体的存储、预计算和缩减
      • 5.1 数据方体格结构
        • 5.1.2 数据方体格
      • 5.2 数据方体的存储
        • 5.2.1 MOLAP
        • 5.2.2 ROLAP
        • 5.2.3 MOLAP和ROLAP实现机制的比较
      • 5.3 数据方体的预计算
        • 5.3.1 预计算相关概念
        • 5.3.2 单表和多表
        • 5.3.3 完整数据方体预计算方法
        • 5.3.4 部分数据方体预计算方法
      • 5.4 数据方体缩减技术
        • 5.4.1 Dwarf数据方体
        • 5.4.2 Condensed数据方体
        • 5.4.3 Quotient数据方体
      • 小结
      • 习题5
    • 第6章 数据方体的索引、查询和维护
      • 6.1 数据方体的索引技术
        • 6.1.1 树索引
        • 6.1.2 位图索引
      • 6.2 数据方体的查询处理和优化技术
        • 6.2.1 子查询划分技术
        • 6.2.2 子查询处理及优化技术
      • 6.3 数据方体的维护技术
      • 小结
      • 习题6
  • 第3篇 数据挖掘技术
    • 第7章 数据挖掘概述
      • 7.1 数据挖掘简介
        • 7.1.1 数据挖掘的特点
        • 7.1.2 数据挖掘与KDD
        • 7.1.3 数据挖掘与OLAP
        • 7.1.4 数据挖掘与数据仓库
        • 7.1.5 数据挖掘的分类
        • 7.1.6 数据挖掘的应用
      • 7.2 数据挖掘算法的组件化思想
        • 7.2.1 模型或模式结构
        • 7.2.2 数据挖掘任务
        • 7.2.3 评分函数
        • 7.2.4 搜索和优化方法
        • 7.2.5 数据管理策略
        • 7.2.6 组件化思想的应用
      • 小结
      • 习题7
    • 第8章 频繁模式挖掘
      • 8.1 频繁项集和关联规则
        • 8.1.1 问题描述
        • 8.1.2 关联规则分类
        • 8.1.3 关联规则挖掘的经典算法Apriori
        • 8.1.4 关联规则挖掘的重要算法FP-Growth
        • 8.1.5 其他关联规则挖掘方法
        • 8.1.6 关联规则的兴趣度
      • 8.2 序列模式挖掘
        • 8.2.1 问题描述
        • 8.2.2 GSP算法
        • 8.2.3 PrefixSpan算法
      • 8.3 频繁子图挖掘
        • 8.3.1 问题描述
        • 8.3.2 基于Apriori的广度优先搜索算法
        • 8.3.3 基于FP-Growth的深度优先搜索算法
      • 小结
      • 习题8
    • 第9章 预测建模:分类和回归
      • 9.1 预测建模简介
        • 9.1.1 用于预测的模型结构
        • 9.1.2 用于预测的评分函数
        • 9.1.3 用于预测的搜索和优化策略
      • 9.2 决策树分类
        • 9.2.1 建树阶段
        • 9.2.2 剪枝阶段
        • 9.2.3 分类规则的生成
        • 9.2.4 可扩展性问题
        • 9.2.5 其他问题
      • 9.3 贝叶斯分类
        • 9.3.1 基本概念
        • 9.3.2 朴素贝叶斯分类
      • 9.4 支持向量机分类
        • 9.4.1 线性可分时的二元分类问题
        • 9.4.2 线性不可分时的二元分类问题
        • 9.4.3 多元分类问题
        • 9.4.4 可扩展性问题
      • 9.5 人工神经网络分类
        • 9.5.1 神经网络的组成
        • 9.5.2 神经网络分类方法
      • 9.6 文本分类实践案例:精准营销中搜狗用户画像挖掘
        • 9.6.1 分词与文本表示
        • 9.6.2 数据简介
        • 9.6.3 数据分析
      • 小结
      • 习题9
    • 第10章 描述建模:聚类
      • 10.1 聚类分析简介
        • 10.1.1 对象间的相似性
        • 10.1.2 其他相似性度量
      • 10.2 聚类方法概述
        • 10.2.1 基于划分的聚类方法
        • 10.2.2 基于密度的聚类方法
        • 10.2.3 基于层次的聚类方法
        • 10.2.4 基于模型的聚类方法
        • 10.2.5 基于方格的聚类方法
      • 10.3 文本聚类的典型应用:话题检测
        • 10.3.1 识别单个话题
        • 10.3.2 PLSA方法
        • 10.3.3 改进的PLSA方法
        • 10.3.4 LDA方法
      • 10.4 实践案例:用LDA实现话题检测
        • 10.4.1 背景及数据
        • 10.4.2 数据预处理
        • 10.4.3 话题检测
      • 小结
      • 习题10
    • 第11章 推荐系统
      • 11.1 概述
        • 11.1.1 推荐系统与网络大数据
        • 11.1.2 推荐系统的产生与发展
        • 11.1.3 推荐系统的本质
      • 11.2 推荐系统的系统架构
        • 11.2.1 用户建模
        • 11.2.2 推荐引擎
      • 11.3 典型推荐算法介绍
        • 11.3.1 基于内容的推荐算法
        • 11.3.2 基于协同过滤的推荐算法
        • 11.3.3 基于上下文的推荐算法
        • 11.3.4 层次化上下文推荐算法
      • 11.4 大数据环境下的推荐系统
        • 11.4.1 特点与挑战
        • 11.4.2 关键技术
      • 11.5 开源大数据典型推荐软件
      • 11.6 大数据推荐系统研究面临的问题
      • 小结
      • 习题11
  • 第4篇 大数据技术
    • 第12章 大数据技术概述
      • 12.1 大数据处理与分析的理论与技术
      • 12.2 大数据的特征
      • 12.3 大数据与数据仓库
      • 12.4 大数据时代的数据仓库Hive
        • 12.4.1 Hive的工作组件
        • 12.4.2 Hive的工作流程
        • 12.4.3 Hive的数据模型
        • 12.4.4 Hive的工作机制
      • 12.5 大数据分析
        • 12.5.1 大数据分析的挑战
        • 12.5.2 深度学习模型简介
      • 小结
      • 习题12
    • 参考文献

数据仓库与数据分析教程”数字课程与纸质教材紧密配合,为读者提供教学视频、电子教案等教学资源,丰富知识的呈现形式,拓展教材的内容,为读者自主学习提供思维与探索的空间,有效帮助读者提升课程学习的效果。

相关图书