本书是高等学校智能财经系列教材之一。本书分为基础篇和应用篇两部分共11章,主要内容包括:数据创建,数据查看,数据清洗;股权性质信息整理——应用数据转置,筛选财务报表数据——应用数据筛选,合并财务报表——应用数据合并,制作数据透视表和计算行业竞争度——应用数据分组,分析一般公司债的票面利率影响因素——应用统计分析,使用ARIMA模型预测股票价格——应用时间序列,绘制股票日K线图——应用可视化表达,建立上市公司价值分类判断指标体系——应用机器学习。
本书选取了大量实践案例,每章设置有实操练习题,适合作为高等学校大数据分析相关课程教材,也可作为社会人士的自学用书。
- 基础篇
- 第1章 数据创建003
- 1.1数据分析模块介绍 003
- 1.2DataFrame简介 004
- 1.3DataFrame数据创建 004
- 1.4基于本地存储的数据创建 007
- 1.5实操练习题 012
- 第2章 数据查看013
- 2.1DataFrame数据属性 013
- 2.2DataFrame数据查看 016
- 2.3实操练习题 021
- 第3章 数据清洗023
- 3.1数据标签重命名 023
- 3.2缺失值处理 026
- 3.3异常值处理 030
- 3.4数据去重 038
- 3.5数据替换 040
- 3.6数据标准化 043
- 3.7实操练习题 045
- 应用篇
- 第4章 股权性质信息整理——应用数据转置049
- 4.1T转置 049
- 4.2行列互换 051
- 4.3数据透视 056
- 4.4数组转置 061
- 4.5应用实践 064
- 4.6实操练习题 068
- 第5章 筛选财务报表数据——应用数据筛选069
- 5.1索引的基本类型 069
- 5.2索引设定与获取 072
- 5.3Series对象的索引与切片 084
- 5.4DataFrame对象的索引与切片 087
- 5.5应用实践 104
- 5.6实操练习题 111
- 第6章 合并财务报表——应用数据合并112
- 6.1数据拼接:concat()与append() 113
- 6.2数据合并:merge()与join() 121
- 6.3combine_first()与update()填充 134
- 6.4应用实践 137
- 6.5实操练习题 143
- 第7章 制作数据透视表和计算行业竞争度——应用数据分组144
- 7.1GroupBy对象 144
- 7.2GroupBy对象的操作 153
- 7.3数据分箱 169
- 7.4实践应用 175
- 7.5实操练习题 181
- 第8章 分析一般公司债的票面利率影响因素——应用统计分析182
- 8.1描述性统计 182
- 8.2随机变量及其概率分布 190
- 8.3推断统计 201
- 8.4回归分析 210
- 8.5应用实践 221
- 8.6实操练习题 228
- 第9章 使用ARIMA模型预测股票价格——应用时间序列229
- 9.1时间序列简介 230
- 9.2时间序列处理 238
- 9.3时间序列基本性质 252
- 9.4应用实践 258
- 9.5实操练习题 260
- 第10章 绘制股票日K线图——应用可视化表达261
- 10.1Matplotlib安装 261
- 10.2Matplotlib库的基础用法 262
- 10.3Matplotlib库的常用技巧 280
- 10.4应用实践 294
- 10.5实操练习题 303
- 第11章 建立上市公司价值分类判断指标体系——应用机器学习304
- 11.1Sklearn概述和安装 304
- 11.2K NN算法 306
- 11.3K Means算法 311
- 11.4PCA降维算法 317
- 11.5线性回归 320
- 11.6逻辑回归 322
- 11.7朴素贝叶斯 326
- 11.8决策树 331
- 11.9随机森林 334
- 11.10支持向量机 337
- 11.11Adaboost算法 341
- 11.12应用实践 343
- 11.13实操练习题 346