本书从概率统计、线性代数和组合优化角度出发, 介绍经典的数据科学与工程算法, 内容涉及数据分析处理全流程的算法及其数学基础, 主要包括抽样算法; 尾概率不等式及其应用; 典型的哈希技术, 如布隆过滤器和局部敏感哈希; 数据流模型以及典型 Misra Gries 算法、Count Sketch 算法; 随机游走及其应用; EM 算法; 特征值计算; 奇异值分解和主成分分析;矩阵分解; 整数规划; 子模函数及其应用; 模块度及社区发现等。全书配有大量翔实的应用实例可供参考, 有相当数量的习题可供读者练习。
本书可作为数据科学与大数据技术专业本科生、研究生相关课程的教材或参考书, 也可供相关领域技术人员参考。
“数据科学与工程算法基础”数字课程与纸质教材紧密配合,为读者提供教学视频、电子教案等教学资源,丰富知识的呈现形式,拓展教材的内容,为读者自主学习提供思维与探索的空间,有效帮助读者提升课程学习的效果。