response = requests.get(url=url, headers=headers) # 对url地址发送请求,并带上请求头 js_str = response.content.decode() data = re.findall(r'"cid":[\d]*', js_str) data = data[0].replace('"cid":', "").replace(" ", "") url = "https://comment.bilibili.com/{}.xml".format(data) response1 = requests.get(url, headers).content.decode() data_list = re.findall('<d.*?>(.*?)</d>', response1) Time = re.findall('<d p="(.*?),', response1)
时间: 2024-04-27 09:19:14 浏览: 198
HTTP请求库java-requests.zip
这是一段 Python 代码,作用是从 Bilibili 视频网站上获取视频的评论信息。具体来说,该代码首先使用 requests 库向指定的视频网页地址发送请求,并带上请求头。然后使用 re 模块中的 `findall()` 函数查找网页源代码中形如 `"cid":数字` 的子字符串,提取出视频的 cid(即评论区的 id 编号)。接着,使用该 cid 构造出评论区的地址,并再次发送请求。最后,使用 re 模块中的 `findall()` 函数查找评论区网页源代码中形如 `<d.*?>(.*?)</d>` 的子字符串,提取出所有的评论信息,并使用 `<d p="(.*?),` 匹配评论信息中的时间信息。
通过这些操作,就可以获取到视频的评论信息和相应的时间信息。
阅读全文