本书主要介绍数据科学中数据准备阶段常用的数据处理方法。全书内容分为个部分:数据准备概览、数据清理、数据变换、数据归约和案例分析。本书注重方法的原理及其应用,在方法原理引介部分强调重要的统计学思想,在方法应用部分强化数据思维和数据处理规范。
本书可作为高等学校统计学类专业、数据科学专业,以及人工智能、计算机科学技术等专业的本科生或研究生的教材或教学参考书,同时可供相关领域工作者参考使用。