Python爬虫爬取酷狗付费歌单全部歌曲保存到当前目录中
时间: 2024-01-02 16:18:07 浏览: 97
python下载歌曲列表中的歌曲.py
这个问题需要使用Python的requests和beautifulsoup库进行爬取和解析HTML页面。
首先,我们需要通过requests库获取酷狗付费歌单的HTML页面,然后通过beautifulsoup库解析HTML页面获取歌曲信息。接着,我们可以使用Python的文件操作函数将歌曲信息保存到当前目录中。
以下是一个简单的Python爬虫程序,可以爬取酷狗付费歌单的全部歌曲并保存到当前目录中:
```python
import requests
from bs4 import BeautifulSoup
import os
# 设置请求头,模拟浏览器请求
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 酷狗付费歌单URL
url = 'https://www.kugou.com/yy/html/userhome/index.html?t=1610114043347#/my/958177'
# 发送请求,获取HTML页面
resp = requests.get(url, headers=headers)
resp.encoding = 'utf-8'
# 解析HTML页面,获取歌曲信息
soup = BeautifulSoup(resp.text, 'html.parser')
songs = soup.select('.songlist > ul > li')
# 保存歌曲信息到当前目录中
with open('songs.txt', 'w', encoding='utf-8') as f:
for song in songs:
name = song.select('a')[0].text
singer = song.select('.singer')[0].text
f.write(name + ' - ' + singer + '\n')
print('All songs saved to songs.txt')
```
在这个程序中,我们首先设置了请求头,模拟浏览器请求。然后,我们发送请求获取HTML页面,并对HTML页面进行解析,通过选择器获取歌曲信息。最后,我们使用Python的文件操作函数将歌曲信息保存到当前目录中。
注意:如果你没有购买酷狗付费歌单,那么你需要自己找一个能够访问的付费歌单URL,替换掉程序中的URL。
阅读全文