《数据科学》课程作业：股票数据分析与可视化

需积分: 0 77 浏览量更新于2024-08-05 收藏 535KB PDF 举报

"《数据科学》课程作业，吴义豪，北京科技大学计通学院通信1804班，上证A股股票数据分析" 本资源详细介绍了进行一项数据科学作业的过程，涉及了数据处理、分析和可视化等多个环节。作业基于上海机场的股票数据，数据源为CSV文件，包含了2003年4月至2016年6月的股票基本信息。在处理数据时，主要遵循以下步骤： 1. **数据读取与预处理**：首先使用`pandas`库的`read_csv`函数读取CSV文件，并按照指定列名保留代码、简称、日期、开盘价、收盘价和成交金额。接着，通过`dropna`方法删除包含空值的行，确保数据的完整性。 2. **日期转换**：将数据集中日期列转换为`datetime`类型，以便进行时间序列分析。这一步骤通过`pd.to_datetime`实现，将日期列设置为DataFrame的索引。 3. **数据汇总**：按照代码、简称和月份对数据进行分组，并计算每月的平均开盘价、平均收盘价以及总成交金额。这一步使用了`resample`函数进行时间频率的重采样，再结合`mean`和`sum`方法求得所需统计量。 4. **数据保存**：将处理后的数据保存到新的CSV文件中，以便后续分析或参考。 5. **数据可视化**：根据月份绘制平均开盘价和平均收盘价的曲线图，横坐标为月份，纵坐标为股价。这通常会使用`matplotlib`或`seaborn`等库来实现，以直观展示股价随时间的变化趋势。 6. **正态分布检验**：对所有月份的总成交金额进行正态性检验，通常可以使用Shapiro-Wilk检验或Kolmogorov-Smirnov检验等方法，以确定这些数值是否符合正态分布。正态分布检验的原理是对比观测数据与正态分布的拟合程度，如果检验统计量的p值小于显著性水平，通常认为数据不服从正态分布。此作业涵盖了数据科学中的基础操作，包括数据清洗、时间序列分析、统计计算和数据可视化，这些都是数据分析师必备的技能。通过这个作业，学生能够熟悉和掌握`pandas`库的基本操作，以及如何应用统计学方法来理解金融数据的特性。

《数据科学》课程作业

同一张图上绘制两条曲线

由于数值差距不大，发现两曲线已经近似重合，为了使效果更加明显，可

以采用双 Y 轴绘制曲线图，将左 Y 轴设置为[3,22]，右 Y 轴设置为[2,21]：

1. fig = plt.figure()

2. ax1 = fig.add_subplot(111)

3. lns1 = ax1.plot(new_stock.index,new_stock['平均开盘价(元)'])

4. ax1.set_ylabel('Y values for 平均开盘价(元)')

5. ax1.set_title("平均开盘价和平均收盘价随月份的变化")

6. ax1.set_ylim([3,22])

7. ax2 = ax1.twinx() # this is the important function

8. lns2 = ax2.plot(new_stock.index,new_stock['平均收盘价(元)'], 'r')

9. ax2.set_ylim([2,21])

10. ax2.set_ylabel('Y values for 平均收盘价(元)')

11. ax2.set_xlabel('月份 ')

12. plt.xticks(new_stock.index[::18],new_stock['日期'][::18])

13. lns = lns1 +lns2

14. labs = [l.get_label() for l in lns]

15. ax1.legend(lns,labs,loc=0)

16. plt.xticks(rotation=-45)

17. plt.show()

剩余10页未读，继续阅读

洋葱庄

粉丝: 21
资源: 311

《数据科学》课程作业：股票数据分析与可视化

测试内容说明文档1

小程序开通相关说明文档1.zip

JavaFX 官方中文说明文档及完整DEMO

Java抓包程序实现(附说明文档)

数字图像处理 MATLAB 大作业 代码及其说明文档

linux系统下的fit客户端filezilla以及安装说明文档

图像配准matlab源代码（里面有说明文档）

SWFUpload v2.5.0版 说明文档 中文完全翻译版.rar

xstream-1.4.8的jar包、源码、说明文档.zip

jdk1.7 说明帮助文档， 不是主程序

最新资源

数字图像处理 MATLAB 大作业代码及其说明文档

SWFUpload v2.5.0版说明文档中文完全翻译版.rar

jdk1.7 说明帮助文档，不是主程序