使用python编一段抓取喜马拉雅的音频
时间: 2023-10-24 12:38:59 浏览: 110
基于python的喜马拉雅音乐爬取
好的,以下是一个简单的Python程序,可以使用requests和beautifulsoup4库抓取喜马拉雅网站上的音频并下载到本地:
```python
import requests
from bs4 import BeautifulSoup
# 设置请求头,模拟浏览器访问
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 目标音频页面的url
url = 'https://www.ximalaya.com/ertong/14164383/'
# 发送请求,获取页面内容
response = requests.get(url, headers=headers)
html = response.text
# 解析页面内容
soup = BeautifulSoup(html, 'html.parser')
# 找到音频的标签
audio_tag = soup.find('audio')
# 获取音频的url
audio_url = audio_tag.get('src')
# 发送下载请求,保存音频到本地
response = requests.get(audio_url, headers=headers)
with open('audio.mp3', 'wb') as f:
f.write(response.content)
```
这段代码假设要抓取的音频页面是 https://www.ximalaya.com/ertong/14164383/ ,音频文件是该页面上唯一的一个音频文件。如果需要抓取其他页面的音频,可以修改url和解析页面的代码。
阅读全文