首页使用python编一段抓取喜马拉雅的音频

使用python编一段抓取喜马拉雅的音频

时间: 2023-10-24 10:38:59 浏览: 118

好的，以下是一个简单的Python程序，可以使用requests和beautifulsoup4库抓取喜马拉雅网站上的音频并下载到本地： ```python import requests from bs4 import BeautifulSoup # 设置请求头，模拟浏览器访问 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 目标音频页面的url url = 'https://www.ximalaya.com/ertong/14164383/' # 发送请求，获取页面内容 response = requests.get(url, headers=headers) html = response.text # 解析页面内容 soup = BeautifulSoup(html, 'html.parser') # 找到音频的标签 audio_tag = soup.find('audio') # 获取音频的url audio_url = audio_tag.get('src') # 发送下载请求，保存音频到本地 response = requests.get(audio_url, headers=headers) with open('audio.mp3', 'wb') as f: f.write(response.content) ``` 这段代码假设要抓取的音频页面是 https://www.ximalaya.com/ertong/14164383/ ，音频文件是该页面上唯一的一个音频文件。如果需要抓取其他页面的音频，可以修改url和解析页面的代码。

阅读全文