网易云歌单内容的爬取
时间: 2024-11-29 15:32:22 浏览: 23
爬取网易云音乐歌单的内容通常需要利用网络爬虫技术,这里提供一个基本的Python示例,使用`requests`和`BeautifulSoup`库来进行网页抓取。请注意,在实际操作中,你需要遵守网站的robots.txt规则,并确保你的行为符合网站的服务条款,尤其是关于爬虫的相关规定。
```python
import requests
from bs4 import BeautifulSoup
import json
# 需要替换为真实的歌单URL
url = 'https://music.163.com/songlist/<歌单id>'
def get_song_list(url):
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}
response = requests.get(url, headers=headers)
if response.status_code == 200:
soup = BeautifulSoup(response.text, 'lxml')
# 查找歌单标题和歌曲信息部分
title = soup.find('div', {'class': 'title'}).text
song_list_container = soup.find('ol', {'class': 'f-hide'})
songs = []
for item in song_list_container.find_all('li'):
song_info = {}
song_name = item.find('a')['title']
play_count = item.find('span', {'class': 'num'}).text
song_info['名称'] = song_name
song_info['播放量'] = play_count
songs.append(song_info)
return title, songs
else:
return None
title, songs_data = get_song_list(url)
print(f"歌单标题: {title}")
print("歌曲列表:")
for song in songs_data:
print(f"{song['名称']} - 播放量: {song['播放量']}")
阅读全文