本书为国家职业教育大数据技术专业教学资源库配套教材,也是高等职业教育计算机类课程新形态一体化教材。
本书选择Python 3作为编程环境,系统讲述编写网络爬虫所需要的各种技术,包括HTTP原理、urllib和Requests网络请求库的使用、正则表达式、XPath等数据提取规则的使用和强大的网络爬虫框架Scrapy的使用,最后通过一个项目“招聘分析监控系统——数据采集系统”介绍如何将以上技术综合运用。
本书配套有微课视频、教学设计、授课用PPT等数字化教学资源。与本书配套的数字课程“数据采集与预处理”已在“智慧职教”平台(www.icve.com.cn)上线,学习者可以登录平台进行在线开放课程的学习,授课教师可以调用本课程构建符合自身教学特色的SPOC课程,详见“智慧职教”服务指南。 读者可发邮件至编辑邮箱1548103297@qq.com获取相关资源。
本书紧跟信息社会发展动态,内容新颖、结构清晰,具有很强的趣味性和实用性。 本书可作为高等职业院校大数据技术及其他相关专业的教材,也可作为大数据技术爱好者的自学用书。