顶部
收藏

Python经济大数据分析


作者:
姚加权、洪永淼
定价:
59.00元
ISBN:
978-7-04-062798-5
版面字数:
550.000千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2024-10-22
读者对象:
高等教育
一级分类:
经济
二级分类:
经济学
三级分类:
经济统计学

本书旨在为读者提供全面且通俗易懂的Python经济大数据分析的相关知识,包含了21个经济领域数据分析的案例。书中内容分为6个模块:模块一介绍了Python在经济大数据分析领域的应用场景和作用,以及Python编程环境的部署和相关的学习资源;模块二介绍了Python的基础语法以及文本分析相关的基础知识;模块三介绍了Python数据分析的重要工具库(Numpy、Pandas、Matplotlib)及相关内容;模块四介绍了常用的机器学习和深度学习算法的原理,并结合实际案例介绍Python程序实现算法的应用;模块五介绍了网络数据采集的相关知识;模块六为文本分析,内容涉及经济文本数据挖掘的方法和最新进展,展示了中文文本数据处理流程以及相关技术在实际场景中的应用。

本书可作为高校经济学相关专业的高年级本科生和研究生的教材,也可作为准备从事数字经济领域研究和工作的高校老师及相关业界人员的Python快捷入门书籍。

  • 前辅文
  • 第1章 导论
    • 1.1 Python与经济大数据分析
      • 1.1.1 经济大数据分析的应用领域
      • 1.1.2 Python在经济数据分析中的作用
    • 1.2 Python编程环境部署
      • 1.2.1 Anaconda环境安装
      • 1.2.2 conda和pip的使用
      • 1.2.3 Pycharm的安装和使用
      • 1.2.4 Jupyter Notebook的安装和使用
    • 1.3 Python学习资源
      • 1.3.1 Github介绍
      • 1.3.2 Kaggle介绍
    • 思考题
  • 第2章 Python语法基础
    • 2.1 变量、缩进和注释
      • 2.1.1 变量
      • 2.1.2 缩进
      • 2.1.3 注释
    • 2.2 数据类型
      • 2.2.1 数字
      • 2.2.2 字符串
    • 2.3 数据结构
      • 2.3.1 列表
      • 2.3.2 元组
      • 2.3.3 集合
      • 2.3.4 字典
    • 2.4 运算符
      • 2.4.1 算术运算符
      • 2.4.2 赋值运算符
      • 2.4.3 比较运算符
      • 2.4.4 逻辑运算符
      • 2.4.5 成员运算符
    • 2.5 Python语句
      • 2.5.1 条件语句
      • 2.5.2 循环语句
      • 2.5.3 条件语句和循环语句结合
      • 2.5.4 异常处理语句
    • 2.6 函数与库
      • 2.6.1 函数
      • 2.6.2 库
    • 2.7 类
    • 思考题
  • 第3章 Python文本分析基础
    • 3.1 文件的操作
    • 3.2 正则表达式
    • 3.3 分词
      • 3.3.1 英文分词
      • 3.3.2 中文分词
    • 3.4 词云图——文本数据可视化
    • 思考题
  • 第4章 Numpy
    • 4.1 数组
      • 4.1.1 创建数组
      • 4.1.2 随机数生成
      • 4.1.3 文件读写
    • 4.2 数组的索引与切片
    • 4.3 数组的操作
      • 4.3.1 数组的排序
      • 4.3.2 数组形状操作
      • 4.3.3 数组的拼接
    • 4.4 数组的相关运算
      • 4.4.1 数组内的运算
      • 4.4.2 数组间的运算
      • 4.4.3 矩阵的操作
    • 思考题
  • 第5章 Pandas
    • 5.1 Pandas数据结构
      • 5.1.1 序列Series
      • 5.1.2 数据框DataFrame
      • 5.1.3 文件读写
    • 5.2 数据框内部的操作
      • 5.2.1 新增和删除数据
      • 5.2.2 数据索引与切片
      • 5.2.3 数据的排序
      • 5.2.4 统计分析
      • 5.2.5 数据透视表
      • 5.2.6 数据分组和聚合
      • 5.2.7 数据转换
      • 5.2.8 数据的特殊值处理
      • 5.2.9 可视化数据
    • 5.3 数据框之间的操作
      • 5.3.1 “concat”函数
      • 5.3.2 “merge”函数
      • 5.3.3 “join”函数
    • 5.4 时间序列处理
      • 5.4.1 时间序列的基本概念及常用函数
      • 5.4.2 重采样操作
      • 5.4.3 滑动窗口操作
    • 思考题
  • 第6章 Matplotlib
    • 6.1 常用图表类型
      • 6.1.1 绘制折线图
      • 6.1.2 绘制散点图
      • 6.1.3 绘制柱状图
      • 6.1.4 绘制直方图
      • 6.1.5 绘制饼图
      • 6.1.6 绘制箱形图
    • 6.2 绘图设置
      • 6.2.1 自定义样式
      • 6.2.2 绘制子图
      • 6.2.3 坐标轴设置
      • 6.2.4 图像大小
    • 6.3 案例:股票K线图绘制
      • 6.3.1 案例背景
      • 6.3.2 获取股票数据
      • 6.3.3 K线图绘制
    • 思考题
  • 第7章 机器学习导论
    • 7.1 机器学习概述
    • 7.2 数据预处理
      • 7.2.1 数据预处理的概念
      • 7.2.2 特征编码
      • 7.2.3 缺失值、异常值和重复值处理
      • 7.2.4 数据标准化
      • 7.2.5 数据离散化
    • 7.3 模型的训练
      • 7.3.1 模型训练过程
      • 7.3.2 模型优化算法及分类
    • 7.4 模型的评估
      • 7.4.1 经验误差和过拟合
      • 7.4.2 模型评估指标
      • 7.4.3 交叉验证
    • 思考题
  • 第8章 回归
    • 8.1 线性回归
      • 8.1.1 线性回归原理
      • 8.1.2 案例:波士顿房价预测
    • 8.2 正则化
      • 8.2.1 正则化原理
      • 8.2.2 案例:美国艾奥瓦州埃姆斯地区房价预测
    • 8.3 逻辑回归
      • 8.3.1 逻辑回归原理
      • 8.3.2 案例:客户流失预警
    • 思考题
  • 第9章 分类
    • 9.1 KNN
      • 9.1.1 KNN原理
      • 9.1.2 案例:社交网络平台汽车广告精准营销
    • 9.2 决策树
      • 9.2.1 决策树原理
      • 9.2.2 案例:成年人群体收入预测
    • 9.3 朴素贝叶斯
      • 9.3.1 朴素贝叶斯原理
      • 9.3.2 案例:P2P平台个人信用评估
    • 9.4 SVM
      • 9.4.1 SVM原理
      • 9.4.2 案例:中文商品评论情感判定
    • 思考题
  • 第10章 集成学习
    • 10.1 集成学习概述
    • 10.2 Bagging方法
      • 10.2.1 随机森林
      • 10.2.2 案例:某产品召回预测
    • 10.3 Boosting方法
      • 10.3.1 AdaBoost
      • 10.3.2 GBDT
      • 10.3.3 XGBoost
      • 10.3.4 案例:信用卡欺诈分类
    • 思考题
  • 第11章 聚类
    • 11.1 聚类概述
    • 11.2 K-Means
    • 11.3 层次聚类
    • 11.4 DBSCAN
    • 11.5 案例:汽车款式聚类
      • 11.5.1 案例背景
      • 11.5.2 数据读取与划分
      • 11.5.3 K-Means模型搭建与评估
      • 11.5.4 层次聚类模型搭建与评估
      • 11.5.5 DBSCAN模型搭建与评估
    • 思考题
  • 第12章 降维
    • 12.1 降维概述
    • 12.2 PCA
      • 12.2.1 PCA原理
      • 12.2.2 案例:沪深300指数成分股收益率的主成分分析
    • 思考题
  • 第13章 深度学习
    • 13.1 深度学习基础
      • 13.1.1 核心思路
      • 13.1.2 神经网络及MLP
      • 13.1.3 反向传播算法
      • 13.1.4 深度学习中的正则化
      • 13.1.5 案例:MLP实现银行单据手写数字识别
    • 13.2 卷积神经网络
      • 13.2.1 核心思路
      • 13.2.2 CNN经典结构
      • 13.2.3 案例:分析K线图评估股票价格趋势
    • 13.3 循环神经网络
      • 13.3.1 RNN模型
      • 13.3.2 长短期记忆网络LSTM模型
      • 13.3.3 案例:LSTM对股票收盘价走势的预测
    • 思考题
  • 第14章 网络数据采集
    • 14.1 网络数据采集基础
      • 14.1.1 收集网络数据的方法
      • 14.1.2 网页的本质和HTML格式
      • 14.1.3 HTTP协议
      • 14.1.4 Robots协议
      • 14.1.5 开发者工具
    • 14.2 网络数据采集三部曲
      • 14.2.1 发送请求
      • 14.2.2 解析数据
      • 14.2.3 存储数据
    • 14.3 网络数据采集程序
      • 14.3.1 案例:数据清洗及数据入库到MongoDB
      • 14.3.2 案例:Selenium库的使用
      • 14.3.3 案例:ChatGPT的API调用
      • 14.3.4 案例:云服务器的部署
    • 思考题
  • 第15章 文本分析
    • 15.1 中文文本大数据分析全流程
      • 15.1.1 语料获取
      • 15.1.2 文本的预处理
      • 15.1.3 文档表示
      • 15.1.4 文档的特征抽取
    • 15.2 NLP新兴技术分析及应用
      • 15.2.1 文本分类和文本聚类
      • 15.2.2 文本摘要
      • 15.2.3 文本回归
      • 15.2.4 主题模型扩展
      • 15.2.5 命名实体识别
      • 15.2.6 关系抽取
      • 15.2.7 知识图谱
    • 15.3 NLP技术在经济学中的应用展望及挑战
      • 15.3.1 深度学习深入文本分析领域
      • 15.3.2 多模态
      • 15.3.3 大语言模型
      • 15.3.4 建立大数据仓库与联邦学习
    • 15.4 案例:中文文本大数据Python程序处理全流程——以年报为例
      • 15.4.1 案例背景
      • 15.4.2 数据预处理
      • 15.4.3 文档表示
      • 15.4.4 特征抽取
    • 15.5 案例:数字化人才需求分析——来自招聘广告的证据
      • 15.5.1 案例背景
      • 15.5.2 数据读取
      • 15.5.3 省份分布情况可视化
      • 15.5.4 行业分布情况可视化
      • 15.5.5 职位描述文本可视化
      • 15.5.6 数字化技能频率统计
    • 思考题
  • 参考文献

相关图书