你可以使用 pandas 和 seaborn库来提取 Excel 中的列名,并绘制直方分布图和累积分布图。然后,使用seabron 库将生成的图片保存到 Word 文档中。
时间: 2024-04-17 16:26:47 浏览: 107
使用Python 库 NumPy、Pandas 和 seaborn来分析泰坦尼克数据集.zip
当然可以!感谢你的建议,我们可以使用 Pandas 和 Seaborn 库来提取 Excel 中的列名,并绘制直方分布图和累积分布图。然后,我们可以使用 Matplotlib 库将生成的图片保存到 Word 文档中。以下是一个示例代码:
```python
import pandas as pd
import seaborn as sns
from docx import Document
import matplotlib.pyplot as plt
# 读取 Excel 文件
df = pd.read_excel('your_file.xlsx')
# 获取所有列名
columns = df.columns
# 创建 Word 文档
doc = Document()
# 遍历每一列
for column in columns:
# 绘制直方分布图
plt.figure()
sns.histplot(data=df, x=column, kde=True)
plt.title(column + ' 直方分布图')
plt.xlabel('值')
plt.ylabel('频数')
plt.savefig('histogram.png', bbox_inches='tight')
plt.close()
# 绘制累积分布图
plt.figure()
sns.histplot(data=df, x=column, kde=True, cumulative=True)
plt.title(column + ' 累积分布图')
plt.xlabel('值')
plt.ylabel('累积频数')
plt.savefig('cumulative.png', bbox_inches='tight')
plt.close()
# 将图片插入到 Word 文档中
doc.add_paragraph(column + ' 直方分布图')
doc.add_picture('histogram.png', width=doc.shared.Cm(12), height=doc.shared.Cm(8))
doc.add_paragraph(column + ' 累积分布图')
doc.add_picture('cumulative.png', width=doc.shared.Cm(12), height=doc.shared.Cm(8))
doc.add_paragraph('\n')
# 保存 Word 文档
doc.save('output.docx')
```
在这段代码中,你需要将 `'your_file.xlsx'` 替换为你的 Excel 文件路径。代码首先使用 `pd.read_excel` 函数读取 Excel 文件,并获取所有的列名。然后,遍历每一列,使用 `sns.histplot` 函数绘制直方分布图和累积分布图,并使用 Matplotlib 的 `savefig` 函数将图片保存到本地。接下来,使用 `python-docx` 库创建一个 Word 文档,并将图片插入到文档中。最后,保存 Word 文档为 `'output.docx'`。
请确保你已经安装了 `pandas`、`seaborn` 和 `python-docx` 库,并将示例代码中的文件路径替换为你自己的文件路径。
阅读全文