用python写一个爬取影视资源的完整代码
时间: 2023-06-26 15:08:09 浏览: 101
python爬虫,爬取网上电影资源
以下一个基本的Python爬取影视资源的代码示例,但请注意不要侵犯版权:
```python
import requests
from bs4 import BeautifulSoup
# 爬取的链接
url = "http://www.example.com/movies"
# 发送请求
r = requests.get(url)
# 使用BeautifulSoup解析网页
soup = BeautifulSoup(r.content, 'html.parser')
# 搜索所有的电影链接
movie_links = soup.find_all('a', class_='movie-link')
# 遍历所有电影链接并获取相应信息
for link in movie_links:
# 获取电影名称和链接
movie_name = link.text.strip()
movie_url = link['href']
# 发送电影详情页面的请求
movie_r = requests.get(movie_url)
movie_soup = BeautifulSoup(movie_r.content, 'html.parser')
# 获取电影详情信息
movie_description = movie_soup.find('div', class_='description').text.strip()
movie_image_url = movie_soup.find('img')['src']
# 将电影信息存储到文件中或者数据库中
with open('movies.txt', 'a') as f:
f.write(f'{movie_name}\n{movie_description}\n{movie_image_url}\n\n')
```
请注意,这只是一个基本的示例,实际情况可能更复杂。此外,网站所有者可能会采取反爬虫措施,因此请确保您的爬虫行为合法。
阅读全文