python中requests和BeautifulSoup爬取酷狗播放量前500完整代码
时间: 2024-09-23 09:08:56 浏览: 63
演示如何使用 Python 的 requests 和 BeautifulSoup 库爬取某个网站上的电子书信息
在Python中,你可以使用`requests`库来发送HTTP请求获取网页内容,然后利用`BeautifulSoup`库解析HTML结构,提取你需要的信息。以下是一个简单的示例,展示如何爬取酷狗音乐排行榜页面的歌曲播放量前五名。请注意,实际网站可能会有反爬虫策略,因此这个例子仅供参考,并可能需要根据酷狗的实际网页结构调整。
```python
import requests
from bs4 import BeautifulSoup
# 定义目标URL(这里假设是酷狗音乐排行榜页面)
url = 'https://www.kugou.com/chart/rank'
# 发送GET请求并获取响应
response = requests.get(url)
if response.status_code == 200:
# 解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')
# 查找包含播放量信息的部分(这通常在歌单列表的某个div或者table元素中)
top_songs = soup.find('div', class_='songlist') or soup.find('table', class_='hot-list')
# 提取前5条数据,这里假设每行是歌曲信息,包括标题和播放量
top_5_songs = top_songs.find_all('tr', limit=5)
for i, song in enumerate(top_5_songs):
title = song.find('a', class_='title').text
play_count = song.find('span', class_='playnum').text
print(f"歌曲{i+1}: {title} 播放量: {play_count}")
else:
print("请求失败,状态码:", response.status_code)
阅读全文