顶部
收藏

大数据分析(第2版)


作者:
主编 程学旗 副主编 靳小龙 刘盛华 李家宁
定价:
42.00元
ISBN:
978-7-04-063683-3
版面字数:
360.00千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2025-12-18
物料号:
63683-00
读者对象:
高等教育
一级分类:
计算机/教育技术类
二级分类:
计算机科学与技术专业课程

本书是大数据新兴领域“十四五”高等教育教材。本书全面介绍大数据分析的相关概念、方法与技术。全书分为基础篇、方法篇与应用篇三篇,共9章。基础篇包含第1章,介绍大数据分析的基本概念和知识;方法篇包含第2~6章,分别介绍常用的大数据分析平台、大数据统计分析、大数据机器学习、深度学习以及图挖掘与分析的相关知识;应用篇包含第7~9章,分别介绍文本数据、多媒体数据以及社会媒体数据三类典型大数据的分析与应用。本书提供了丰富的习题以帮助读者巩固所学的内容。

本书既可作为高等学校大数据相关专业本科生或研究生的教材,也可供大数据分析领域的专业技术人员参考。

  • 前辅文
  • 基础篇
    • 第1章 大数据分析概述
      • 1.1 大数据
        • 1.1.1 大数据的由来
        • 1.1.2 大数据的典型特征
      • 1.2 大数据分析
        • 1.2.1 大数据分析的内涵
        • 1.2.2 大数据分析的类型
        • 1.2.3 大数据分析算法与系统
      • 1.3 大数据分析进阶
        • 1.3.1 数据编织
        • 1.3.2 数据分析算法安全
  • 方法篇
    • 第2章 大数据分析平台
      • 2.1 机器学习大数据分析平台
        • 2.1.1 PyTorch
        • 2.1.2 TensorFlow
        • 2.1.3 PaddlePaddle
      • 2.2 分布式大数据分析平台
        • 2.2.1 Impala
        • 2.2.2 Spark ML
        • 2.2.3 Apache Pig
      • 2.3 多源异构大数据分析平台
        • 2.3.1 Delta Lake
        • 2.3.2 Apache Doris
        • 2.3.3 Apache Presto
      • 习题
    • 第3章 大数据统计分析
      • 3.1 相关性分析
        • 3.1.1 相关关系
        • 3.1.2 传统统计相关性分析
        • 3.1.3 大数据中的统计相关性分析
      • 3.2 统计分析与哈希
        • 3.2.1 哈希基本概念
        • 3.2.2 局部敏感哈希
        • 3.2.3 发现相似性
        • 3.2.4 最小计数Sketch
      • 3.3 线性回归分析
        • 3.3.1 向量空间基本概念
        • 3.3.2 线性回归
        • 3.3.3 最小二乘法
        • 3.3.4 略图方法
      • 习题
    • 第4章 大数据机器学习
      • 4.1 机器学习概述
        • 4.1.1 基本概念和流程
        • 4.1.2 体系分类
        • 4.1.3 机器学习基础理论
        • 4.1.4 大数据时代的机器学习
      • 4.2 决策树与集成学习
        • 4.2.1 决策树
        • 4.2.2 集成学习概述
        • 4.2.3 梯度提升决策树
        • 4.2.4 随机森林
      • 4.3 概率图模型
        • 4.3.1 隐马尔可夫模型
        • 4.3.2 条件随机场
        • 4.3.3 主题模型
      • 习题
    • 第5章 深度学习
      • 5.1 深度学习基础
        • 5.1.1 深度学习概述
        • 5.1.2 神经网络结构
        • 5.1.3 神经网络训练算法
      • 5.2 深度学习进阶
        • 5.2.1 高级网络结构
        • 5.2.2 生成模型
        • 5.2.3 大模型范式
      • 5.3 深度学习对抗攻防
        • 5.3.1 对抗鲁棒性概述
        • 5.3.2 对抗攻击算法
        • 5.3.3 对抗防御算法
      • 习题
    • 第6章 图挖掘与分析
      • 6.1 大图模式分析
        • 6.1.1 图与幂律分布定义
        • 6.1.2 静态图相关模式
        • 6.1.3 动态图相关模式
      • 6.2 稠密子图检测
        • 6.2.1 稠密子图检测
        • 6.2.2 二部图稠密子图检测
        • 6.2.3 谱图理论与稠密子图检测
        • 6.2.4 稠密子张量检测
      • 6.3 图摘要与图划分
        • 6.3.1 图摘要概念
        • 6.3.2 图摘要算法
        • 6.3.3 图划分概念
        • 6.3.4 图划分与社区检测算法
      • 6.4 图表示学习与图神经网络
        • 6.4.1 图表示学习定义
        • 6.4.2 图表示学习算法与模型
        • 6.4.3 图卷积神经网络定义
        • 6.4.4 图卷积神经网络模型
      • 习题
  • 应用篇
    • 第7章 文本数据分析
      • 7.1 文本表达
        • 7.1.1 排序学习模型
        • 7.1.2 上下文单词预测模型
        • 7.1.3 全局词向量表示模型
        • 7.1.4 预训练语言模型
      • 7.2 文本匹配
        • 7.2.1 文本匹配任务
        • 7.2.2 基于神经网络的文本匹配
        • 7.2.3 基于预训练模型的文本匹配
        • 7.2.4 文本匹配的评价
      • 7.3 文本挖掘
        • 7.3.1 文本预处理
        • 7.3.2 文本分类与聚类
        • 7.3.3 文本知识抽取
        • 7.3.4 文本情感分析
      • 7.4 文本生成
        • 7.4.1 文本生成简介
        • 7.4.2 基于神经网络的文本生成
        • 7.4.3 基于预训练模型的文本生成
        • 7.4.4 基于大语言模型的文本生成
        • 7.4.5 文本生成的评价
      • 习题
    • 第8章 多媒体数据分析
      • 8.1 概述
        • 8.1.1 多媒体数据分析
        • 8.1.2 应用案例
      • 8.2 多媒体数据处理
        • 8.2.1 图像处理
        • 8.2.2 音频处理
        • 8.2.3 视频处理
      • 8.3 多媒体数据挖掘
        • 8.3.1 聚类与关联分析
        • 8.3.2 分类与识别
        • 8.3.3 序列分析与预测
      • 8.4 多媒体数据可视化
        • 8.4.1 多媒体数据可视化工具
        • 8.4.2 视频摘要
      • 习题
    • 第9章 社会媒体数据分析
      • 9.1 社会媒体数据基本分析方法
        • 9.1.1 社交网络的度量方法
        • 9.1.2 PageRank算法
        • 9.1.3 PageRank算法优化
        • 9.1.4 SimRank算法
      • 9.2 社会媒体数据基础应用
        • 9.2.1 用户画像
        • 9.2.2 信息传播与影响力最大化
        • 9.2.3 跨网络用户映射
      • 9.3 社会媒体数据综合分析
        • 9.3.1 社交机器人检测
        • 9.3.2 基于位置的社交网络
        • 9.3.3 社交网络广告投放
      • 习题
  • 参考文献

相关图书