正则表达式爬取网易云音乐
时间: 2023-11-22 12:47:39 浏览: 229
正则表达式是一种用来匹配字符串的工具,可以用来从网页中提取所需信息。在爬取网易云音乐时,可以使用正则表达式来匹配歌曲名称、歌手、专辑、评论等信息。以下是一个简单的示例代码,可以爬取网易云音乐热歌榜中的歌曲名称和评论:
```python
import requests
import re
url = 'https://music.163.com/discover/toplist?id=3778678'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers).text
# 匹配歌曲名称
song_pattern = re.compile(r'<a href="/song\?id=\d+">(.+?)</a>')
song_list = song_pattern.findall(response)
# 匹配评论
comment_pattern = re.compile(r'<div class="cnt f-brk">(.+?)</div>')
comment_list = comment_pattern.findall(response)
# 打印结果
for i in range(len(song_list)):
print('歌曲名称:', song_list[i])
print('评论:', comment_list[i])
print('------------------------')
```
阅读全文