用python求excel表格最后三十行第五列到第四十四列每一列与倒数第四列之间的相关系数,并画出曲线图
时间: 2023-06-19 07:05:03 浏览: 97
可以使用 pandas 和 matplotlib 库来完成这个任务。
首先需要安装 pandas 和 matplotlib 库,可以使用以下命令进行安装:
```
pip install pandas matplotlib
```
接下来,可以使用 pandas 的 read_excel 方法来读取 Excel 文件。假设要读取的文件名为 data.xlsx,可以这样读取最后 30 行:
```python
import pandas as pd
df = pd.read_excel('data.xlsx', sheet_name='Sheet1', skiprows=lambda x: x < len(df)-30)
```
其中,skiprows 参数可以用来跳过前面的行。lambda 函数中的 x 表示当前读取到的行号,如果 x 小于 len(df)-30,就跳过这一行。
接下来,可以使用 pandas 的 corr 方法来计算相关系数:
```python
corr_matrix = df.iloc[:, -40:-4].corrwith(df.iloc[:, -4])
```
其中,iloc 方法用于选择第五列到倒数第五列之间的列,corrwith 方法用于计算这些列与倒数第四列的相关系数。
最后,可以使用 matplotlib 来画出曲线图:
```python
import matplotlib.pyplot as plt
plt.plot(corr_matrix)
plt.show()
```
完整代码如下:
```python
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_excel('data.xlsx', sheet_name='Sheet1', skiprows=lambda x: x < len(df)-30)
corr_matrix = df.iloc[:, -40:-4].corrwith(df.iloc[:, -4])
plt.plot(corr_matrix)
plt.show()
```
阅读全文