1.统计IMDB评分各评分段的影片数。 2.各年票房变化的趋势。 3上榜IMDB的次数最多的导演的前5位、前10位。 4.影片上榜的次数和影片的评分的相关性。 5.票房和Mate评分的相关性。 6.时长和Mate评分的相关性。用python对以上内容进行可视化分析
时间: 2024-03-10 17:45:39 浏览: 222
电影数据分析.docx
好的,您的问题已经记录下来了!以下是每个问题的可视化分析代码示例:
1. 统计IMDB评分各评分段的影片数
```python
import pandas as pd
import seaborn as sns
df = pd.read_csv('imdb.csv')
sns.histplot(data=df, x='imdb_rating', bins=10)
```
2. 各年票房变化的趋势
```python
import pandas as pd
import seaborn as sns
df = pd.read_csv('imdb.csv')
sns.lineplot(data=df, x='title_year', y='gross')
```
3. 上榜IMDB的次数最多的导演的前5位、前10位
```python
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('imdb.csv')
top_directors = df['director_name'].value_counts().head(10)
plt.bar(x=top_directors.index, height=top_directors.values)
plt.xticks(rotation=45)
```
4. 影片上榜的次数和影片的评分的相关性
```python
import pandas as pd
import seaborn as sns
df = pd.read_csv('imdb.csv')
sns.scatterplot(data=df, x='num_voted_users', y='imdb_rating')
```
5. 票房和Mate评分的相关性
```python
import pandas as pd
import seaborn as sns
df = pd.read_csv('imdb.csv')
sns.scatterplot(data=df, x='gross', y='metascore')
```
6. 时长和Mate评分的相关性
```python
import pandas as pd
import seaborn as sns
df = pd.read_csv('imdb.csv')
sns.scatterplot(data=df, x='duration', y='metascore')
```
以上是每个问题的可视化分析代码示例,希望能够帮助您!
阅读全文