抓取QSchina上的榜单数据
时间: 2023-11-28 21:48:32 浏览: 132
python爬虫获取2023世界大学排名
要抓取QSchina上的榜单数据,您可以使用Python编写一个Web爬虫程序。以下是一个简单的示例程序,可以帮助您开始:
```python
import requests
from bs4 import BeautifulSoup
# 指定要爬取的榜单页面URL
url = "https://www.qschina.cn/ranking"
# 发起请求并获取响应内容
response = requests.get(url)
html_content = response.content
# 使用BeautifulSoup解析HTML内容
soup = BeautifulSoup(html_content, 'html.parser')
# 找到榜单表格
table = soup.find('table', {'class': 'table'})
rows = table.find_all('tr')
# 遍历表格数据并输出
for i, row in enumerate(rows):
if i == 0: # 表头
columns = row.find_all('th')
column_names = [column.text.strip() for column in columns]
print(column_names)
else: # 数据行
data = row.find_all('td')
row_values = [d.text.strip() for d in data]
print(row_values)
```
此程序使用requests库发送HTTP请求,并使用BeautifulSoup库解析HTML内容。它找到了榜单表格并遍历了表格数据,最后输出了每一行的值。
请注意,此示例程序仅适用于此榜单页面的HTML结构。如果榜单页面的结构发生变化,您可能需要修改程序以适应新的HTML结构。
阅读全文