python爬虫酷狗top500并存于Excel中的完整代码
时间: 2024-12-10 09:27:54 浏览: 14
Python爬虫项目合集(源代码)
Python爬虫使用`requests`库获取网页内容,然后通过`BeautifulSoup`解析HTML,提取需要的数据。为了将数据保存到Excel文件,可以使用`pandas`库。以下是一个简单的示例,展示如何爬取酷狗音乐排行榜前500位歌曲的信息,并将其存储到Excel表格中:
```python
import requests
from bs4 import BeautifulSoup
import pandas as pd
# 爬取酷狗首页
url = "https://music.kugou.com/top500/"
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 提取所需信息,这里假设我们关注歌名、歌手和链接
data = []
song_list = soup.select('.songlist li')
for song in song_list[:500]: # 取前500位
title = song.find('a', class_='tit').text.strip()
singer = song.find('span', class_='artist').text.strip()
link = song.find('a')['href']
data.append([title, singer, link])
# 将数据转化为DataFrame
df = pd.DataFrame(data, columns=['歌曲名称', '歌手', '链接'])
# 存储到Excel文件
file_name = '酷狗Top500歌曲.xlsx'
df.to_excel(file_name, index=False)
阅读全文