首页import requests from bs4 import BeautifulSoup url = "https://www.555dy1.com/voddetail/58397.html" # 发送请求并获取网页内容 response = requests.get(url) # 解析HTML内容，并提取播放地址 soup = BeautifulSoup(response.text, 'html.parser') links = soup.find_all('a', class_='module-play-list-link') # print(links) # 输出每个链接的播放地址 for link in links: print(link['href']) videolist = 'https://www.555dy1.com/'+ link['href'] print (videolist)

import requests from bs4 import BeautifulSoup url = "https://www.555dy1.com/voddetail/58397.html" # 发送请求并获取网页内容 response = requests.get(url) # 解析HTML内容，并提取播放地址 soup = BeautifulSoup(response.text, 'html.parser') links = soup.find_all('a', class_='module-play-list-link') # print(links) # 输出每个链接的播放地址 for link in links: print(link['href']) videolist = 'https://www.555dy1.com/'+ link['href'] print (videolist)

时间: 2024-02-26 13:52:10 浏览: 36

您可以考虑使用集合（set）来去除重复的播放地址，并使用字符串的 `startswith()` 方法判断链接是否以特定的字符串开头，以筛选出不同的播放器。下面是示例代码： ``` import requests from bs4 import BeautifulSoup url = "https://www.555dy1.com/voddetail/58397.html" response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') links = soup.find_all('a', class_='module-play-list-link') playlists = set() for link in links: href = link['href'] if href.startswith('/play/'): playlist = 'https://www.555dy1.com' + href playlists.add(playlist) for playlist in playlists: print(playlist) ``` 在上述代码中，我们首先创建了一个空的集合 `playlists`，用于存储不同播放器的播放地址。遍历所有链接时，我们使用 `startswith()` 方法判断链接是否以 `/play/` 开头，如果是则将其转换为完整的播放地址，并加入集合中。最后，我们遍历集合中的所有地址，并输出它们。由于集合中不会存在重复元素，因此重复的地址会被自动去除。