python电影数据分析案例
时间: 2023-09-06 15:08:19 浏览: 124
基于python的电影数据分析.zip
5星 · 资源好评率100%
以下是一个简单的Python电影数据分析案例:
```python
# 导入必要的库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
# 读取数据
df = pd.read_csv('movies.csv')
# 查看数据信息
print(df.head())
print(df.info())
# 统计电影类型的数量
genre_count = df['genres'].str.split('|', expand=True).stack().value_counts()
print(genre_count)
# 统计电影类型的分布情况
genre_counts = df['genres'].str.split('|', expand=True).stack().value_counts()
genre_counts.plot(kind='pie', autopct='%1.1f%%')
plt.title('Movie Genres Distribution')
plt.show()
# 统计电影评分的分布情况
sns.distplot(df['vote_average'])
plt.title('Movie Rating Distribution')
plt.show()
# 统计电影时长的分布情况
sns.distplot(df['runtime'].dropna())
plt.title('Movie Runtime Distribution')
plt.show()
# 统计电影预算和收入的关系
sns.regplot(x='budget', y='revenue', data=df)
plt.title('Budget vs. Revenue')
plt.show()
```
这个案例中,我们使用了pandas和numpy库读取和处理数据,使用了matplotlib和seaborn库进行数据可视化分析。我们统计了电影类型的数量和分布情况,电影评分的分布情况,电影时长的分布情况以及电影预算和收入的关系。这些分析可以帮助我们更好地了解电影市场的基本情况,为电影制作和营销提供参考。
阅读全文