用python的etree爬取nba中国官网现役球员的数据,并将结果放到excel中的一个python脚本
时间: 2023-02-21 14:22:30 浏览: 104
下面是一份使用 Python 的 `etree` 爬取 NBA 中国官网现役球员数据,并将结果写入 Excel 的示例代码:
```python
import requests
from lxml import etree
import openpyxl
# 请求网页数据
url = "https://nba.hupu.com/players"
html = requests.get(url).text
# 使用 etree 解析网页数据
selector = etree.HTML(html)
players_list = selector.xpath('//div[@class="players_list"]/ul/li')
# 创建 Excel 工作簿
workbook = openpyxl.Workbook()
sheet = workbook.active
sheet.title = "球员数据"
# 在第一行写入表头
sheet.cell(row=1, column=1, value="姓名")
sheet.cell(row=1, column=2, value="位置")
sheet.cell(row=1, column=3, value="身高")
sheet.cell(row=1, column=4, value="体重")
# 遍历每个球员的信息
for i, player in enumerate(players_list):
name = player.xpath('.//div[@class="players_name"]/a/text()')[0]
position = player.xpath('.//div[@class="players_pos"]/text()')[0]
height = player.xpath('.//div[@class="players_height"]/text()')[0]
weight = player.xpath('.//div[@class="players_weight"]/text()')[0]
# 写入 Excel
sheet.cell(row=i+2, column=1, value=name)
sheet.cell(row=i+2, column=2, value=position)
sheet.cell(row=i+2, column=3, value=height)
sheet.cell(row=i+2, column=4, value=weight)
# 保存 Excel 工作簿
workbook.save("players_data.xlsx")
```
这份代码首先使用 `requests` 库请求 NBA 中国官网的球员数据页面,然后使用 `etree` 解析网页数据,获取每个球员的信息。最后,使用 `openpyxl` 库创
阅读全文