首页实现USNews 美国大学排名的爬虫

实现USNews 美国大学排名的爬虫

时间: 2023-12-17 18:27:31 浏览: 44

以下是使用Python实现USNews美国大学排名爬虫的步骤： 1. 导入所需的库，包括requests和beautifulsoup4。 2. 使用requests库获取USNews美国大学排名网页的HTML内容。 3. 使用beautifulsoup4库解析HTML内容，提取出需要的数据。 4. 将提取出的数据存储到一个文件或数据库中。 ```python # 导入所需的库 import requests from bs4 import BeautifulSoup # 设置请求头，模拟浏览器访问 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 发送请求，获取HTML内容 url = 'https://www.usnews.com/best-colleges/rankings/national-universities' response = requests.get(url, headers=headers) html = response.text # 解析HTML内容，提取出需要的数据 soup = BeautifulSoup(html, 'html.parser') rankings = soup.find_all('div', class_='sep') for ranking in rankings: name = ranking.find('a').text.strip() rank = ranking.find('span', class_='rankscore-bronze').text.strip() print(name, rank) # 将提取出的数据存储到一个文件或数据库中 # 这里只是简单地将数据打印出来，实际应用中需要根据需求进行相应的处理和存储 ```