顶部
收藏

数据科学与工程导论


作者:
主编 骆斌、申富饶、郝亚东 副主编 袁创鑫 戴鑫俊 李涛
定价:
39.00元
ISBN:
978-7-04-064883-6
版面字数:
260.00千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2025-09-01
物料号:
64883-00
读者对象:
高等教育
一级分类:
计算机/教育技术类

本书是大数据新兴领域“十四五”高等教育教材。本书系统而深入地介绍了数据科学与工程的基本概念、核心理论、关键技术及其实践应用,旨在为读者构建从理论到实践的全方位知识体系。本书内容涵盖了对数据概述以及大数据全生命周期(数据采集与预处理、数据存储、数据分析、数据可视化)的介绍。在数据安全与治理方面,强调了数据时代下的安全挑战与治理策略。最后通过社交媒体、机场航班等实践案例,帮助读者将所学知识融会贯通,提升解决实际问题的能力。

此外,本书提供了丰富的配套教学资源,包括教学课件、关键概念与技术讲解视频、程序源代码等,读者借助这些资源可以巩固课堂所学,同时通过动手实践提升技能水平。

本书可作为数据科学与大数据技术、计算机科学与技术等专业相关课程的教材,也可供对数据科学与工程相关知识感兴趣的读者阅读。

  • 前辅文
  • 第1章 数据概述
    • 1.1 问题导入
    • 1.2 发展历史
      • 1.2.1 大数据发展历程
      • 1.2.2 机遇与挑战
    • 1.3 基本概念
      • 1.3.1 数据定义
      • 1.3.2 数据格式
      • 1.3.3 数据特征
    • 1.4 工作流程
      • 1.4.1 数据理解
      • 1.4.2 数据准备
      • 1.4.3 模型建立
      • 1.4.4 模型评估
      • 1.4.5 模型发布
    • 1.5 实践领域
    • 本章小结
    • 习题
  • 第2章 数据采集与预处理
    • 2.1 问题导入
    • 2.2 数据类型
      • 2.2.1 结构化数据
      • 2.2.2 半结构化数据
      • 2.2.3 非结构化数据
    • 2.3 数据清洗
      • 2.3.1 异常值处理
      • 2.3.2 缺失值处理
      • 2.3.3 数据转换
      • 2.3.4 数据类型转换
    • 2.4 数据集成
      • 2.4.1 数据源识别
      • 2.4.2 数据整合
      • 2.4.3 数据加载
      • 2.4.4 数据验证
      • 2.4.5 安全与隐私
    • 2.5 数据规约
      • 2.5.1 维度规约
      • 2.5.2 属性选择
      • 2.5.3 数据聚合
      • 2.5.4 数据抽样
      • 2.5.5 数据压缩
    • 2.6 案例:录井、测井、完井数据采集与处理
      • 2.6.1 项目背景
      • 2.6.2 案例步骤
      • 2.6.3 案例小结
    • 本章小结
    • 习题
  • 第3章 数据存储
    • 3.1 问题导入
    • 3.2 数据库系统概述
      • 3.2.1 数据库系统的相关概念
      • 3.2.2 数据库系统的分类
    • 3.3 关系数据库系统与非关系数据库系统
      • 3.3.1 MySQL
      • 3.3.2 SQL Server
      • 3.3.3 Redis
      • 3.3.4 MongoDB
    • 3.4 分布式系统
      • 3.4.1 Hadoop
      • 3.4.2 Apache Spark
      • 3.4.3 Apache Kafka
    • 3.5 分布式存储
      • 3.5.1 HBase
      • 3.5.2 GaussDB
    • 3.6 案例:石油钻井数据湖构建
      • 3.6.1 项目背景
      • 3.6.2 数据湖概述
      • 3.6.3 Iceberg概述
      • 3.6.4 案例步骤
    • 本章小结
    • 习题
  • 第4章 数据分析
    • 4.1 问题导入
    • 4.2 描述性数据分析
      • 4.2.1 统计特征
      • 4.2.2 计算数据特征量
      • 4.2.3 统计工具
    • 4.3 探索性数据分析
      • 4.3.1 相关性分析
      • 4.3.2 可视化分析
    • 4.4 预测性数据分析
      • 4.4.1 机器学习
      • 4.4.2 深度学习
      • 4.4.3 强化学习
    • 本章小结
    • 习题
  • 第5章 数据可视化
    • 5.1 问题导入
    • 5.2 可视化原理
      • 5.2.1 视觉层次结构
      • 5.2.2 数据关系与模式识别
      • 5.2.3 图形真实性与完整性
      • 5.2.4 多样性与包容性
    • 5.3 数据可视化工具
      • 5.3.1 Tableau
      • 5.3.2 Power BI
      • 5.3.3 Pandas
      • 5.3.4 NumPy
      • 5.3.5 ECharts
      • 5.3.6 阿里云(DataV)
    • 5.4 案例:石油钻井可视化大屏
      • 5.4.1 字段描述
      • 5.4.2 数据分析和可视化及实现
      • 5.4.3 案例总结
    • 本章小结
    • 习题
  • 第6章 数据安全与治理
    • 6.1 问题导入
    • 6.2 数据质量
      • 6.2.1 数据质量内容
      • 6.2.2 数据质量评估
      • 6.2.3 数据质量改进与优化
    • 6.3 数据安全
      • 6.3.1 数据安全组成
      • 6.3.2 数据安全法规
      • 6.3.3 数据安全面临的挑战
      • 6.3.4 隐私保护
    • 6.4 数据资产
      • 6.4.1 数据资产分类
      • 6.4.2 数据监控与审计
      • 6.4.3 数据工作流与跨部门协作
    • 6.5 数据治理
      • 6.5.1 数据治理框架
      • 6.5.2 数据治理实践路径
    • 本章小结
    • 习题
  • 第7章 数据综合应用案例分析
    • 7.1 微博大数据存储
      • 7.1.1 项目背景
      • 7.1.2 Hadoop生态系统关键组件介绍
      • 7.1.3 实现步骤
      • 7.1.4 项目总结
    • 7.2 航班大数据分析
      • 7.2.1 项目背景
      • 7.2.2 数据字段说明
      • 7.2.3 数据集成
      • 7.2.4 数据分析与可视化
    • 7.3 异构数据压缩存证
      • 7.3.1 项目背景
      • 7.3.2 压缩技术应用
      • 7.3.3 区块链技术应用
      • 7.3.4 合规性考量
    • 7.4 互联网舆情分析系统
      • 7.4.1 项目背景
      • 7.4.2 案例步骤
    • 本章小结
  • 参考文献

相关图书


相关数字化产品