使用所有在上交所交易股票2000年1月至2021年12月的月度收益率数据，注意，该数据为excel格式，第一列为股票代码，第二列为日期，第三列为股票的收盘价数据，总共有800余只股票的19万余行数据，需要先对数据进行处理。然后，以2001年1月至2020年12月作为投资组合构造期，在每一个月，首先，计算过去 1个月、3个月、6个月和12个月的累积收益率；然后，在每个月的月末，根据过去1个月、3个月、6个月和12个月的收益率，由低到高分别将所有股票排序，根据排序构造5个等权重投资组合；接下来将这5个组合持有1个月、3个月、6个月或12个月；最后计算每个组合的平均持有期收益率，并检验股市中具有惯性效应还是反转效应。给出上述过程的python代码，注意不要出现AttributeError: 'numpy.ndarray' object has no attribute 'index'的错误形式，也不要出现KeyError: '1'的错误。

时间: 2024-03-10 20:49:13 浏览: 85

为了处理这些数据，我们可以使用pandas模块来读取Excel数据，然后对数据进行处理和分析。以下是代码示例：首先，我们需要导入所需的模块： ```python import pandas as pd import numpy as np ``` 然后，我们可以使用`pandas.read_excel()`函数来读取Excel数据，并将其存储在一个DataFrame对象中： ```python data = pd.read_excel('data.xlsx') ``` 接下来，我们需要对数据进行处理，首先是去除缺失值： ```python data.dropna(inplace=True) ``` 然后，我们可以按照日期对数据进行排序： ```python data.sort_values(by=['日期'], inplace=True) ``` 接下来，我们可以为每个月计算累积收益率： ```python data['累积收益率1个月'] = data.groupby(['股票代码'])['收盘价'].pct_change(1).add(1).cumprod() data['累积收益率3个月'] = data.groupby(['股票代码'])['收盘价'].pct_change(3).add(1).cumprod() data['累积收益率6个月'] = data.groupby(['股票代码'])['收盘价'].pct_change(6).add(1).cumprod() data['累积收益率12个月'] = data.groupby(['股票代码'])['收盘价'].pct_change(12).add(1).cumprod() ``` 接下来，我们可以为每个月创建投资组合： ```python portfolios = [] for i in range(len(data)): if data.iloc[i]['日期'].month == 1: # 计算过去1个月、3个月、6个月、12个月的收益率 returns1 = data.iloc[i-21:i]['累积收益率1个月'] returns3 = data.iloc[i-63:i]['累积收益率3个月'] returns6 = data.iloc[i-126:i]['累积收益率6个月'] returns12 = data.iloc[i-252:i]['累积收益率12个月'] # 对股票按照收益率排序 sorted_returns1 = returns1.sort_values() sorted_returns3 = returns3.sort_values() sorted_returns6 = returns6.sort_values() sorted_returns12 = returns12.sort_values() # 构造等权重投资组合 portfolio1 = sorted_returns1.head(160).index.values.tolist() portfolio2 = sorted_returns1[160:320].index.values.tolist() portfolio3 = sorted_returns1[320:480].index.values.tolist() portfolio4 = sorted_returns1[480:640].index.values.tolist() portfolio5 = sorted_returns1[640:].index.values.tolist() portfolios.append([portfolio1, portfolio2, portfolio3, portfolio4, portfolio5]) ``` 然后，我们可以计算每个投资组合的平均持有期收益率： ```python portfolio_returns = [] holding_periods = [1, 3, 6, 12] for portfolio in portfolios: portfolio_returns.append([]) for holding_period in holding_periods: returns = [] for stocks in portfolio: stock_returns = data.loc[data['股票代码'].isin(stocks)].groupby(['日期'])['收盘价'].pct_change(holding_period).add(1).prod().mean() returns.append(stock_returns) portfolio_returns[-1].append(np.mean(returns)) ``` 最后，我们可以使用t检验来检验股市中是否具有惯性效应或反转效应： ```python from scipy.stats import ttest_ind for i, portfolio in enumerate(portfolio_returns): print('投资组合{}：'.format(i+1)) for j, holding_period in enumerate(holding_periods): t, p = ttest_ind(portfolio[j], portfolio[(j+1)%4]) if p < 0.05: if np.mean(portfolio[j]) < np.mean(portfolio[(j+1)%4]): print('持有期{}个月具有反转效应'.format(holding_period)) else: print('持有期{}个月具有惯性效应'.format(holding_period)) else: print('持有期{}个月没有显著差异'.format(holding_period)) ``` 完整代码如下：

相关推荐

上海证券交易所科创板企业发行上市申报及推荐暂行规定（2021年4月修订）.pdf

超全整理上市公司对赌协议数据大全（更新至2021年4月）

优质资料（2021-2022年收藏）上海证券交易所交易规则.doc

python将excel工作表1的第29列的“上海证券交易所”替换为“深圳证券交易所”

python将excel工作表1的AC列的“上海证券交易所”替换为“深圳证券交易所”

python将excel工作表1的第29列的“上海证券交易所”替换为“深圳证券交易所”，将原文件删除并将修改后的文件保存在原文件夹中，保留原文件的格式

python获取东方财富网股票600521周期为1分钟，日期为20230606的数据

假设上交所即将推出一只以“南方中证 500ETF”为基础资产的新的欧式看跌期权，其行权 价为 6 元，到期月为 11 月，请基于已有数据采用合理的方法进行隐含波动率插值，求出该 期权在 5 月 8 日-11 日的价格

用akshare获取股票数据，并将列索引更换为英文

tqsdk下载股票上交所全部日线历史数据，并且下载到指定目录，下载完成之后就行压缩再把原文件删除

上海证券交易所 爬虫

上交所股票DBF文件格式

用python爬取上海证券交易所官网伊利股份和分众传媒的股价

在 tushare 用python获取600159历史1分钟不复权k线数据，

优质资料（2021-2022年收藏）上海证券交易所交易规则修订.docx

优质资料（2021-2022年收藏）上海证券交易所交易规则修订课案.doc

最新推荐

上海证券交易所部署数据仓库经验之谈

上海证券交易所LDDS系统Level-2行情接口说明书(2.0.4)_20210421.pdf

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

2． 通过python绘制y=e-xsin(2πx)图像

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

导入numpy库，创建两个包含9个随机数的3*3的矩阵，将两个矩阵分别打印出来，计算两个数组的点积并打印出来。（random.randn()、dot（）函数）

假设上交所即将推出一只以“南方中证 500ETF”为基础资产的新的欧式看跌期权，其行权价为 6 元，到期月为 11 月，请基于已有数据采用合理的方法进行隐含波动率插值，求出该期权在 5 月 8 日-11 日的价格

上海证券交易所爬虫

2．通过python绘制y=e-xsin(2πx)图像