顶部
收藏

数据科学实践


作者:
主编:陈跃国 覃雄派 副主编:李锡荣 余力 覃飙
定价:
34.50元
ISBN:
978-7-04-064834-8
版面字数:
260.00千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2025-11-13
物料号:
64834-00
读者对象:
高等教育
一级分类:
计算机/教育技术类
二级分类:
计算机科学与技术专业课程

本书是大数据新兴领域“十四五”高等教育教材。本书从数据科学实践的概论讲起,围绕智慧农业、制造业、金融行业、医疗行业、互联网行业、公益事业等领域的实践案例综述相关技术,并给出数据分析流程和关键代码示例。本书致力于围绕不同行业的具体数据科学案例,深入浅出地介绍解决数据科学问题的过程中涉及的相关方法和技术工具,帮助读者掌握解决此类问题的数据科学实践过程。

本书既可作为高等学校大数据与人工智能相关专业基础技能培养的教材,也可供从事数据科学相关工作的专业技术人员参考。

  • 前辅文
  • 第1章 概论
    • 1.1 如何发挥大数据的价值
    • 1.2 CRISP-DM流程
    • 1.3 CRISP-DM实例
    • 1.4 可信数据科学
    • 1.5 习题
  • 第2章 智慧农业中的粮食产量预测
    • 2.1 粮食产量预测问题
    • 2.2 粮食产量预测的关键技术
      • 2.2.1 基于特征工程的传统机器学习方法
      • 2.2.2 基于遥感图像的深度学习方法
    • 2.3 粮食产量预测实践
      • 2.3.1 数据收集
      • 2.3.2 数据预处理
      • 2.3.3 数据质量提升
      • 2.3.4 产量预测模型
      • 2.3.5 灾害影响分析
    • 2.4 总结与展望
      • 2.4.1 技术展望
      • 2.4.2 应用展望
    • 2.5 习题
    • 2.6 实验与实验环境
      • 2.6.1 实验一
      • 2.6.2 实验二
      • 2.6.3 实验环境
  • 第3章 制造业中的产品质量优化
    • 3.1 智能制造的内涵
    • 3.2 产品质量优化问题
      • 3.2.1 产品质量优化方法
      • 3.2.2 产品质量优化平台
    • 3.3 产品质量优化的关键技术
      • 3.3.1 回归模型
      • 3.3.2 特征重要性评估
      • 3.3.3 因果分析
    • 3.4 产品质量优化实践
      • 3.4.1 数据预处理
      • 3.4.2 特征工程
      • 3.4.3 数据质量提升与产品质量预测
      • 3.4.4 特征重要性评估与参数优化调控
    • 3.5 总结与展望
      • 3.5.1 回归模型与产品质量优化
      • 3.5.2 特征重要性评估
      • 3.5.3 特征工程技术
      • 3.5.4 制造行业的流程细分
      • 3.5.5 参数优化调控
      • 3.5.6 制造业大模型
    • 3.6 习题
    • 3.7 实验与实验环境
      • 3.7.1 实验一
      • 3.7.2 实验二
      • 3.7.3 实验环境
  • 第4章 金融行业中的量化交易
    • 4.1 智慧金融与量化交易问题
      • 4.1.1 智慧金融的内涵
      • 4.1.2 智慧金融与量化交易发展历程
      • 4.1.3 量化交易问题的核心
      • 4.1.4 量化交易系统
      • 4.1.5 量化交易系统的评价
    • 4.2 量化交易的关键技术
      • 4.2.1 传统机器学习技术
      • 4.2.2 深度学习技术与大模型
    • 4.3 量化交易实践
      • 4.3.1 数据下载
      • 4.3.2 数据标注
      • 4.3.3 特征构造与样本生成
      • 4.3.4 机器学习模型训练、评价与超参数调优
      • 4.3.5 交易策略构建与评价
    • 4.4 总结与展望
    • 4.5 习题
    • 4.6 实验与实验环境
      • 4.6.1 实验一
      • 4.6.2 实验二
      • 4.6.3 实验环境
  • 第5章 医疗行业中的病变识别
    • 5.1 智慧医疗与人工智能辅助诊断问题
    • 5.2 糖尿病视网膜病变识别的关键技术
      • 5.2.1 眼底解剖结构提取技术
      • 5.2.2 眼底病灶检测技术
      • 5.2.3 病种识别与分级技术
      • 5.2.4 模型评估技术
    • 5.3 糖尿病视网膜病变识别实践
      • 5.3.1 数据准备
      • 5.3.2 模型开发
      • 5.3.3 模型评估
    • 5.4 总结与展望
    • 5.5 习题
  • 第6章 互联网行业中的社交群组推荐
    • 6.1 社交网络与推荐问题
      • 6.1.1 社交网络
      • 6.1.2 社交网络中的群组推荐问题
    • 6.2 智能推荐的关键技术
      • 6.2.1 用户画像技术
      • 6.2.2 传统个性化推荐
      • 6.2.3 深度学习推荐
    • 6.3 社交群组推荐建模
      • 6.3.1 群组推荐问题定义
      • 6.3.2 群体推荐模型
      • 6.3.3 基于图高阶学习的群体推荐模型
      • 6.3.4 模型的实验评估
    • 6.4 社交群组推荐实践
      • 6.4.1 数据准备
      • 6.4.2 数据读取
      • 6.4.3 模型关键模块部分实现
    • 6.5 总结与展望
    • 6.6 习题
  • 第7章 公益事业中的危化品知识库问答
    • 7.1 危化品管理问题
    • 7.2 危化品知识库
      • 7.2.1 化学品安全技术说明书文档标注
      • 7.2.2 化学品安全技术说明书命名实体识别
    • 7.3 危化品知识库问答系统
      • 7.3.1 经典自然语言处理的问答系统
      • 7.3.2 基于大模型的问答系统
    • 7.4 总结与展望
    • 7.5 习题
    • 7.6 实验与实验环境
      • 7.6.1 实验一
      • 7.6.2 实验二
      • 7.6.3 实验环境
  • 参考文献

相关图书