本书全面系统地介绍数据挖掘与知识发现领域的基本原理、研究方法、部分产品和工业标准。全书共15章。第1章介绍数据分析技术的发展历程,KDD与数据挖掘的概念、对象、过程、方法、相关领域和应用范围。第2章介绍关联规则基本模型和Apriori等经典算法。第3章在介绍聚类概念的基础上,讨论包括划分、层次、密度等聚类方法。第4章介绍ID3、CART等决策树算法。第5章介绍图方法实现贝叶斯分类。第6章介绍VC维、支持向量机。第7章介绍人工神经网络。第8章介绍近期热点技术——深度学习。第9章介绍不平衡数据学习。第10章讨论过拟合、模型选择、模型评估等内容。第11、12章是不确定性、模糊性方法,分别介绍粗糙集和模糊集。第13章是Web挖掘,介绍Web链接分析、推荐系统和社交网络挖掘。第14章介绍数据预处理和可视化技术。第15章介绍数据挖掘工具与产品。
本书可用作高校计算机类专业本科及研究生相关课程的教材和教学参考书,也可供有关人员学习参考。为方便读者学习,随书同时提供配套的教学视频、PPT、参考答案等辅助教学资源。
“数据挖掘与知识发现”数字课程与纸质教材紧密配合,为读者提供教学视频、课件习题解答等教学资源。丰富了知识的呈现形式,拓展了教材内容,可有效帮助读者提升课程学习的效果,并为读者自主学习提供思维与探索的空间。