python 根据IMDB比较票房和Mate评分的相关性,图表形式
时间: 2024-03-25 21:39:59 浏览: 98
好的,下面是一个更完整的代码示例,可以绘制相关性热力图和散点图:
```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# 读取数据
imdb_df = pd.read_csv('imdb.csv')
metacritic_df = pd.read_csv('metacritic.csv')
# 合并数据
merged_df = pd.merge(imdb_df, metacritic_df, on='title')
# 计算相关系数
corr = merged_df[['imdb_rating', 'metacritic_score', 'box_office']].corr()
# 绘制相关性热力图
sns.heatmap(corr, annot=True, cmap='coolwarm')
plt.title('Correlation Heatmap')
plt.show()
# 绘制散点图
plt.scatter(merged_df['imdb_rating'], merged_df['metacritic_score'], s=merged_df['box_office']/1000000, alpha=0.5)
plt.xlabel('IMDB Rating')
plt.ylabel('Metacritic Score')
plt.title('IMDB Rating vs. Metacritic Score')
plt.show()
```
在这个代码示例中,我们首先读取 IMDB 和 Metacritic 的数据,并将它们合并成一个数据集。然后,我们使用 Pandas 中的 `corr` 函数计算票房、IMDB 评分和 Metacritic 评分之间的相关系数,并使用 Seaborn 绘制相关性热力图。最后,我们使用 Matplotlib 绘制散点图,其中点的大小表示票房大小,点的透明度表示点的密度。
阅读全文