python爬取周杰伦歌词
时间: 2023-09-30 19:08:27 浏览: 255
可以使用Python中的requests和BeautifulSoup库来爬取周杰伦的歌词。
首先,需要找到一个包含周杰伦歌词的网站,比如https://mojim.com/twy103436.htm。然后,使用requests库获取该网站的HTML代码,再用BeautifulSoup库解析HTML代码,最后提取出歌词内容即可。
以下是一个简单的示例代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://mojim.com/twy103436.htm'
# 获取网页HTML代码
response = requests.get(url)
html = response.text
# 解析HTML代码
soup = BeautifulSoup(html, 'html.parser')
# 获取歌词内容
lyrics = soup.find('dl', {'id': 'fsZx3'}).find_all('dd')
# 打印歌词
for lyric in lyrics:
print(lyric.text)
```
注意,不同的网站HTML代码结构可能会不同,需要根据实际情况进行调整。另外,爬取网站内容时需要遵守相关法律法规,不得侵犯他人合法权益。
相关问题
用python爬取周杰伦专辑
可以使用 Python 的 requests 和 BeautifulSoup 库来爬取周杰伦的专辑信息。以下是一个简单的示例代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://music.douban.com/subject_search?search_text=%E5%91%A8%E6%9D%B0%E4%BC%A6&cat=1003'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
albums = soup.find_all(class_='subject-item')
for album in albums:
title = album.find(class_='info').a.get('title')
artist = album.find(class_='artist').get_text().strip()
year = album.find(class_='pub').get_text().strip().split('/')[0]
print(f'{title} - {artist} ({year})')
```
这个代码会在豆瓣音乐上搜索周杰伦的专辑,并输出专辑的名称、艺术家和发行年份。你可以根据需要修改代码来获取其他信息,比如专辑的封面图片等。
python爬取周杰伦演唱会
要爬取周杰伦演唱会的信息,你可以使用Python的requests库发送HTTP请求获取页面数据,并使用BeautifulSoup库解析HTML。首先,你需要找到一个包含周杰伦演唱会信息的网站,并确定网站上的URL和参数。然后,使用requests库发送GET请求,将参数添加到URL中。接下来,使用BeautifulSoup库解析返回的HTML页面,提取演唱会信息。最后,你可以将提取的信息保存到文件或进行其他处理。
以下是一个示例代码,用于爬取指定网站上的周杰伦演唱会信息:
```
import requests
from bs4 import BeautifulSoup
def crawl_concert_info():
url = "https://example.com/concerts" # 替换为实际的演唱会信息网站URL
params = {
"artist": "周杰伦" # 替换为实际的歌手名字
}
response = requests.get(url, params=params)
html = response.text
soup = BeautifulSoup(html, "html.parser")
concert_list = soup.find_all("div", class_="concert") # 根据实际情况定位演唱会信息所在的HTML元素
for concert in concert_list:
concert_info = concert.find("h3").text # 根据实际情况提取演唱会信息的具体内容
print(concert_info)
crawl_concert_info()
```
在上述代码中,你需要将`url`替换为实际的演唱会信息网站的URL,将`params`中的`"artist"`替换为实际的歌手名字。然后,使用BeautifulSoup库的`find_all`方法和其他方法来定位和提取演唱会信息的具体内容。
请注意,具体的网站结构和演唱会信息的提取方式可能因网站而异。你需要根据实际情况进行调整和修改代码。
阅读全文