爬取NBA球员数据+可视化分析代码
时间: 2023-10-03 09:02:09 浏览: 59
以下是Python代码,用于爬取NBA球员数据并可视化分析:
```python
import requests
import pandas as pd
import matplotlib.pyplot as plt
# 爬取球员数据
url = "https://www.basketball-reference.com/leagues/NBA_2022_per_game.html"
html = requests.get(url).content
df_list = pd.read_html(html)
df = df_list[-1]
# 数据清洗
df = df.drop(df[df.Age == 'Age'].index)
df = df.fillna(0)
df = df.drop(['Rk'], axis=1)
# 数据类型转换
df[['G', 'GS', 'MP', 'FG', 'FGA', '3P', '3PA', '2P', '2PA', 'FT', 'FTA', 'ORB', 'DRB', 'TRB', 'AST', 'STL', 'BLK', 'TOV', 'PF', 'PTS']] = df[['G', 'GS', 'MP', 'FG', 'FGA', '3P', '3PA', '2P', '2PA', 'FT', 'FTA', 'ORB', 'DRB', 'TRB', 'AST', 'STL', 'BLK', 'TOV', 'PF', 'PTS']].apply(pd.to_numeric)
# 可视化分析
plt.scatter(df.PTS, df.AST)
plt.xlabel('Points per game')
plt.ylabel('Assists per game')
plt.title('NBA Player Stats')
plt.show()
```
该代码爬取了2022年NBA球员的场均数据,并对场均得分和场均助攻进行了散点图可视化分析。你可以根据自己的需求和兴趣修改代码,例如更改数据源网站、可视化方式等。