首页用python写一个爬取影视资源的完整代码

用python写一个爬取影视资源的完整代码

时间: 2023-06-26 18:08:09 浏览: 104

以下一个基本的Python爬取影视资源的代码示例，但请注意不要侵犯版权： ```python import requests from bs4 import BeautifulSoup # 爬取的链接 url = "http://www.example.com/movies" # 发送请求 r = requests.get(url) # 使用BeautifulSoup解析网页 soup = BeautifulSoup(r.content, 'html.parser') # 搜索所有的电影链接 movie_links = soup.find_all('a', class_='movie-link') # 遍历所有电影链接并获取相应信息 for link in movie_links: # 获取电影名称和链接 movie_name = link.text.strip() movie_url = link['href'] # 发送电影详情页面的请求 movie_r = requests.get(movie_url) movie_soup = BeautifulSoup(movie_r.content, 'html.parser') # 获取电影详情信息 movie_description = movie_soup.find('div', class_='description').text.strip() movie_image_url = movie_soup.find('img')['src'] # 将电影信息存储到文件中或者数据库中 with open('movies.txt', 'a') as f: f.write(f'{movie_name}\n{movie_description}\n{movie_image_url}\n\n') ``` 请注意，这只是一个基本的示例，实际情况可能更复杂。此外，网站所有者可能会采取反爬虫措施，因此请确保您的爬虫行为合法。

阅读全文