数据可视化数据分析图5张代码
时间: 2023-08-08 13:14:10 浏览: 92
好的,以下是5张数据可视化和数据分析图的代码示例:
1. 电影类型分布饼图
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_csv("top250.csv")
# 统计电影类型
genres = data["genres"].str.split("/", expand=True).stack().reset_index(drop=True)
genres_counts = genres.value_counts()
# 绘制饼图
plt.pie(genres_counts, labels=genres_counts.index, autopct='%1.1f%%')
plt.title("Movie Genres Distribution")
plt.show()
```
2. 电影评分分布直方图
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_csv("top250.csv")
# 绘制直方图
plt.hist(data["rating"], bins=10, edgecolor="black")
plt.title("Movie Rating Distribution")
plt.xlabel("Rating")
plt.ylabel("Count")
plt.show()
```
3. 电影时长分布箱线图
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_csv("top250.csv")
# 绘制箱线图
plt.boxplot(data["duration"], vert=False)
plt.title("Movie Duration Distribution")
plt.xlabel("Duration (min)")
plt.show()
```
4. 电影年份分布折线图
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_csv("top250.csv")
# 统计电影年份
year_counts = data["year"].value_counts().sort_index()
# 绘制折线图
plt.plot(year_counts.index, year_counts.values)
plt.title("Movie Year Distribution")
plt.xlabel("Year")
plt.ylabel("Count")
plt.show()
```
5. 电影国家/地区分布条形图
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_csv("top250.csv")
# 统计电影国家/地区
countries = data["countries"].str.split("/", expand=True).stack().reset_index(drop=True)
countries_counts = countries.value_counts()
# 绘制条形图
plt.bar(countries_counts.index, countries_counts.values)
plt.title("Movie Countries/Regions Distribution")
plt.xlabel("Country/Region")
plt.ylabel("Count")
plt.xticks(rotation=90)
plt.show()
```
以上是5张数据可视化和数据分析图的代码示例,仅供参考。实际使用中,还需要根据需要进行调整和修改。
阅读全文