爬取虎扑NBA球员信息+可视化分析代码

时间: 2023-10-01 15:06:28 浏览: 252

基于python的NBA球员数据可视化分析源码+文档.zip

5星 · 资源好评率100%

以下是爬取虎扑NBA球员信息并进行可视化分析的Python代码： ``` import requests from bs4 import BeautifulSoup import pandas as pd import seaborn as sns import matplotlib.pyplot as plt # 设置请求头 headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 请求网页 url = "https://nba.hupu.com/players" response = requests.get(url, headers=headers) # 解析网页 soup = BeautifulSoup(response.content, 'html.parser') table = soup.find('table', class_='players_table') # 获取表格列名 columns = [] for th in table.find_all('th'): columns.append(th.text.strip()) # 获取表格数据 data = [] for tr in table.find_all('tr')[1:]: row = [] for td in tr.find_all('td'): row.append(td.text.strip()) data.append(row) # 生成DataFrame df = pd.DataFrame(data, columns=columns) # 数据清洗 df['球队'] = df['球队'].apply(lambda x: x.split('\n')[0]) df['位置'] = df['位置'].apply(lambda x: x.split('\n')[0]) df['出生日期'] = df['出生日期'].apply(lambda x: x.split('\n')[0]) df['身高'] = df['身高'].apply(lambda x: x.split('\n')[0]) df['体重'] = df['体重'].apply(lambda x: x.split('\n')[0]) df['经验'] = df['经验'].apply(lambda x: x.split('\n')[0]) df['薪资'] = df['薪资'].apply(lambda x: x.replace(',', '')) # 数据类型转换 df['身高'] = df['身高'].astype(float) df['体重'] = df['体重'].astype(float) df['薪资'] = df['薪资'].astype(float) # 可视化分析 sns.set(style="whitegrid") # 球员数量分布 sns.countplot(x="位置", data=df) # 球员薪资分布 sns.histplot(df['薪资'], kde=False) # 球员身高、体重关系 sns.scatterplot(x="身高", y="体重", data=df) plt.show() ``` 代码解释： 1. 首先导入需要使用的库。 2. 设置请求头，发起GET请求，获取网页的HTML文本。 3. 使用BeautifulSoup解析HTML文本，找到目标表格。 4. 获取表格的列名和数据。 5. 将数据存储到Pandas的DataFrame中。 6. 进行数据清洗和类型转换。 7. 使用Seaborn进行可视化分析，绘制球员数量分布、球员薪资分布和球员身高、体重关系图。 8. 显示图形。注意：爬取网页信息需要遵守相关规定和法律法规。请勿非法爬取网站信息。

阅读全文

爬取虎扑NBA球员信息+可视化分析代码

相关推荐

基于python的NBA球员数据可视化分析.zip

使用scrapy框架爬取大量球员信息，可作为毕业设计，下载即可运行。

python爬取虎扑球员得分信息并做可视化处理

用requests,beatuifulsoup4和openpyxl库爬取虎扑体育的数据并且可视化

python爬取京东商品评价信息+图表可视化

课程设计-基于SpringBoot + Mybatis+python爬虫NBA球员数据爬取可视化+源代码+文档+sql+效果图

基于Python实现猫眼电影数据爬取+数据分析+数据可视化 (高分代码).zip

Python实现美食数据爬取+数据分析+数据可视化.zip

基于Python实现猫眼电影数据爬取+数据分析+数据可视化.zip

python 新闻爬取（数据爬取+可视化）.zip

python爬取拉勾网存excel+数据可视化web分析

基于python的疫情数据爬虫及可视化源码+项目说明（丁香园疫情数据爬取+echarts可视化+flask框架）.zip

基于python爬取豆瓣电影Top250+数据分析与可视化源码+项目说明.zip

数据采集与预处理之xpath爬取豆瓣电影新片榜信息(爬取代码+可视化大屏+数据爬取csv文件)

Python课程设计-豆瓣读书TOP250的数据爬取及可视化设计+源代码+文档说明+数据库

去哪儿网旅游数据爬取+可视化分析

基于Python实现简单的链.家数据爬取和可视化系统+源代码+文档说明+界面截图(96分期末大作业)

毕业设计基于Python电影数据爬取及可视化源码+论文资料

天气预报 ：天气数据集爬取 + 可视化 + 13种模型预测

最新推荐

Python爬取数据并实现可视化代码解析

（二）爬取新房销售信息——数据分析+可视化篇

爬虫代码+MapReduce代码+可视化展示代码.docx

数据采集汇聚+数据治理+数据分析+数据可视化工具

Python爬取股票信息，并可视化数据的示例

IEEE 14总线系统Simulink模型开发指南与案例研究

管理建模和仿真的文件

【数据安全黄金法则】：R语言中party包的数据处理与隐私保护

Takagi-Sugeno模糊控制方法的原理是什么？如何设计一个基于此方法的零阶或一阶模糊控制系统？

STLinkV2.J16.S4固件更新与应用指南

天气预报：天气数据集爬取 + 可视化 + 13种模型预测