网络爬虫代码: 输入电影名称就可以下载整部电影,下载至本地端。 除了下载影片之外,还可以加注电影信息,例如:评价、主角等。
时间: 2024-04-02 17:31:58 浏览: 19
好的,以下是一个简单的网络爬虫代码,可以实现输入电影名称就可以下载整部电影,并且可以加注电影信息:
```python
import requests
from bs4 import BeautifulSoup
# 输入电影名称
movie_name = input('请输入电影名称:')
# 搜索电影
search_url = f'https://www.dy2018.com/e/search/result/index.php?searchid=5235'
search_params = {
'keyboard': movie_name.encode('gbk')
}
search_headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}
search_html = requests.get(search_url, params=search_params, headers=search_headers).content
search_soup = BeautifulSoup(search_html, 'html.parser')
search_results = search_soup.find_all('div', {'class': 'co_content8'})[1].find_all('table')
# 获取电影下载链接
for result in search_results:
movie_url = result.find('a').get('href')
movie_name = result.find('a').text
movie_html = requests.get(movie_url, headers=search_headers).content
movie_soup = BeautifulSoup(movie_html, 'html.parser')
movie_links = movie_soup.find('div', {'id': 'Zoom'}).find_all('a')
for link in movie_links:
if 'ftp://' in link.get('href'):
download_url = link.get('href')
print(f'电影名称:{movie_name}')
print(f'下载链接:{download_url}')
# 下载电影
filename = movie_name + '.mp4'
r = requests.get(download_url, headers=search_headers, stream=True)
with open(filename, 'wb') as f:
for chunk in r.iter_content(chunk_size=1024):
if chunk:
f.write(chunk)
# 加注电影信息
rating = input('请输入电影评分:')
actor = input('请输入主演:')
with open(filename + '.txt', 'w') as f:
f.write(f'电影名称:{movie_name}\n')
f.write(f'下载链接:{download_url}\n')
f.write(f'电影评分:{rating}\n')
f.write(f'主演:{actor}\n')
break
break
```
这个代码使用了 requests 和 BeautifulSoup 库,通过搜索电影名称,然后解析搜索结果页面,找到对应的电影下载链接。然后使用 requests 库下载电影文件,并加注电影信息。需要注意的是,该代码只是一个示例,对于不同的电影网站,需要针对网站的 HTML 结构进行相应的修改。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)