顶部
收藏

商科大数据应用技术


作者:
周会林 王强
定价:
38.00元
ISBN:
978-7-04-062322-2
版面字数:
220.000千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2024-09-06
读者对象:
五年制高职
一级分类:
会计类
二级分类:
会计专业

本书是五年制高职专用教材,依据五年制高等职业教育财会类专业人才培养方案,以通用大数据采集技术为基础,聚焦网络大数据采集工具在商科的应用。

本书紧扣“大数据与会计”专业(群)教学实践,以程序设计语言(Python)为学习支架,在应用信息技术手段完成财务大数据采集、整理的同时,初步掌握脚本语言的语法逻辑,自定义函数的设计和库功能函数的调用等。本书以大量丰富的财务工作场景作为实践对象,使学生能够从真实岗位工作情境出发,认知工作流程规范和复杂问题,提高学生进行财务大数据采集的综合能力。

全书共包括七个项目:大数据与Python网络爬虫概述、Requests库、正则表达式、XPath语言、采集静态网页数据、采集动态网页数据、反爬虫技术的应对策略。

本书可作为职业院校财会类专业教学用书,也可作为会计从业人员自主学习参考用书。

  • 前辅文
  • 项目一 大数据与Python网络爬虫概述
    • 任务一 初识大数据
    • 任务二 初识网络爬虫
    • 任务三 认识网页结构
    • 任务四 认识HTTP
    • 任务五 解析网络爬虫工作原理
  • 项目二 Requests库
    • 任务一 安装Requests库
    • 任务二 发送Request请求
    • 任务三 处理Request响应
  • 项目三 正则表达式
    • 任务一 设置正则表达式
    • 任务二 使用匹配函数
    • 任务三 使用正则表达式抓取股票资讯
  • 项目四 XPath语言
    • 任务一 设置XPath规则
    • 任务二 获取网页节点属性和文本
    • 任务三 使用XPath规则抓取管理者信息
  • 项目五 采集静态网页数据
    • 任务一 识别静态网页
    • 任务二 使用解析库分析网页
    • 任务三 使用XPath Helper解析网页
  • 项目六 采集动态网页数据
    • 任务一 制定动态网页抓取流程
    • 任务二 调用Selenium加载浏览器
    • 任务三 存储动态JSON数据
    • 任务四 抓取上市公司财务报表
  • 项目七 反爬虫技术的应对策略
    • 任务一 应对反爬虫策略
    • 任务二 遵循robots协议和爬虫技术法规

相关图书