python请求网页内容，得到page_html = response.read()，如何计算内容大小

可以使用Python内置的len()函数来计算网页内容的大小。具体实现可以使用以下代码： ```python import urllib.request url = "https://www.example.com" response = urllib.request.urlopen(url) page_html = response.read() content_size = len(page_html) print("The size of the web page content is: {} bytes".format(content_size)) ``` 其中，`content_size`即为网页内容的大小，以字节为单位。

import urllib.parse import urllib.request url = 'http://www.qybor.com:8500/shortMessage' #【183.36.116.118】 user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' encode = 'UTF-8' username = 'pyhxjnyy' passwd = '03214' needstatus = 'true' phone='17765241887' msg = '您好，您的验证码是：12345【企业宝】' values = { 'username' : username, 'passwd' : passwd, 'needstatus' : needstatus, 'phone' : phone, 'msg' : msg, 'encode' : encode } headers = { 'User-Agent' : user_agent } data = urllib.parse.urlencode(values) req = urllib.request.Request(url+'?'+data) response = urllib.request.urlopen(req) the_page = response.read() print(the_page)

好的，我会帮你调用接口。以下是你提供的代码： ```python import urllib.parse import urllib.request url = 'http://www.qybor.com:8500/shortMessage' user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' encode = 'UTF-8' username = 'pyhxjnyy' passwd = '03214' needstatus = 'true' phone = '17765241887' msg = '您好，您的验证码是：12345【企业宝】' values = { 'username': username, 'passwd': passwd, 'needstatus': needstatus, 'phone': phone, 'msg': msg, 'encode': encode } headers = {'User-Agent': user_agent} data = urllib.parse.urlencode(values) req = urllib.request.Request(url + '?' + data, headers=headers) response = urllib.request.urlopen(req) the_page = response.read() print(the_page) ``` 请注意，你需要确保你的网络连接正常，并且修改代码中的接口URL、用户名、密码、手机号码以及消息内容等参数，以适应你的实际需求。

优化import os.path import pprint import textwrap import threading import time import requests import re import json from queue import Queue q_list = Queue(100) from threading import Thread headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 ' 'Safari/537.36' } # 获取m3u8视频片段的所有地址 def get_links(url): # 获取视频页的网页源代码 r = requests.get(url, headers=headers) info = re.findall('window.pageInfo = window.videoInfo =(.?)window.videoResource', r.text, re.DOTALL)[0].strip()[0:-1] # 获取m3u8列表地址 filename = json.loads(info)['title'] m3u8_url = json.loads(json.loads(info)["currentVideoInfo"]["ksPlayJson"])['adaptationSet'][0]['representation'][1]['url'] m3u8_list = requests.get(m3u8_url, headers=headers).text ts_files = re.sub('#.', '', m3u8_list).split() ts_length = len(ts_files) # 获取m3u8地址片段 for num, ts in enumerate(ts_files): ts_url = 'https://ali-safety-video.acfun.cn/mediacloud/acfun/acfun_video/' + ts q_list.put([ts_url, num]) return filename, ts_length # print(filename, ts_url) # 分别下载这些视频片段-多线程 def download(filename): while not q_list.empty(): ts_url, num = q_list.get() video_content = requests.get(ts_url, headers=headers).content with open(f'video/{filename}_{num}.ts', 'wb') as f: f.write(video_content) print(f'{threading.current_thread().name}已下载...第{num}个片段') # 合并视频-构成完整的片段 def combine(filename, ts_length): fp = open(f'video/{filename}.mp4', 'ab') for i in range(ts_length): if os.path.exists(f'video/{filename}_{i}.ts'): with open(f'video/{filename}_{i}.ts', 'rb') as f: ts_slice = f.read() fp.write(ts_slice) print(f'已合并...第{i}个片段') os.remove(f'video/{filename}_{i}.ts') print(f'已删除...第{i}个片段') fp.close() # 主文件调用 def main(): start_time = time.time() url = 'https://www.acfun.cn/v/ac41409604' filename, ts_length = get_links(url) tasks = [] for i in range(3): th = Thread(target=download, args=(filename,), name=f'线程{i}') th.start() tasks.append(th) for t in tasks: t.join() combine(filename, ts_length) end_time = time.time() print(f'总共耗时{end_time - start_time}')

可以考虑对代码进行如下优化： 1. 将所有的 import 放在文件开头，按照标准库、第三方库和本地库的顺序进行排列，方便阅读和维护。 2. 可以将获取视频片段地址和下载视频片段的代码放在同一个函数中，这样可以减少函数调用和确保两个步骤的原子性。 3. 可以使用 with 语句来打开文件，这样可以确保文件对象被正确关闭，避免出现文件泄露和意外删除的情况。 4. 可以使用 f-strings 来格式化输出，这样可以使代码更加简洁、易读和易维护。 5. 可以对代码中的变量名进行调整，使其更符合 Python 的命名规范，并且更加易于理解和使用。下面是优化后的代码： ```python import os.path import pprint import textwrap import threading import time import requests import re import json from queue import Queue from threading import Thread headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36' } def download_video_segments(url, ts_queue): # 获取视频页的网页源代码 response = requests.get(url, headers=headers) info = re.findall('window.pageInfo = window.videoInfo =(.*?)window.videoResource', response.text, re.DOTALL)[0].strip()[0:-1] # 获取m3u8列表地址 filename = json.loads(info)['title'] m3u8_url = json.loads(json.loads(info)["currentVideoInfo"]["ksPlayJson"])['adaptationSet'][0]['representation'][1]['url'] m3u8_list = requests.get(m3u8_url, headers=headers).text ts_files = re.sub('#.*', '', m3u8_list).split() ts_length = len(ts_files) # 获取m3u8地址片段 for num, ts in enumerate(ts_files): ts_url = 'https://ali-safety-video.acfun.cn/mediacloud/acfun/acfun_video/' + ts ts_queue.put([ts_url, num]) return filename, ts_length def download_video_segment(filename, ts_queue): while not ts_queue.empty(): ts_url, num = ts_queue.get() video_content = requests.get(ts_url, headers=headers).content with open(f'video/{filename}_{num}.ts', 'wb') as f: f.write(video_content) print(f'{threading.current_thread().name}已下载...第{num}个片段') def combine_video_segments(filename, ts_length): with open(f'video/{filename}.mp4', 'ab') as fp: for i in range(ts_length): if os.path.exists(f'video/{filename}_{i}.ts'): with open(f'video/{filename}_{i}.ts', 'rb') as f: ts_slice = f.read() fp.write(ts_slice) print(f'已合并...第{i}个片段') os.remove(f'video/{filename}_{i}.ts') print(f'已删除...第{i}个片段') def main(): start_time = time.time() url = 'https://www.acfun.cn/v/ac41409604' ts_queue = Queue(100) filename, ts_length = download_video_segments(url, ts_queue) tasks = [] for i in range(3): th = Thread(target=download_video_segment, args=(filename, ts_queue), name=f'线程{i}') th.start() tasks.append(th) for t in tasks: t.join() combine_video_segments(filename, ts_length) end_time = time.time() print(f'总共耗时{end_time - start_time}')

python请求网页内容，得到page_html = response.read()，如何计算内容大小

相关推荐

Python读取网页内容的方法

html_convert.zip_html conve_python 网页_python 网页_read text pytho

2.通过post传入flag=php://filter/read=convert.base64-encode/resource=flag.php可以读取到base64的内容，base64解码即可获得完整内容怎么操作

如何用python获取html网页中的表格

帮我写一段爬取指定网站内容并把内容按照指定编码保存到txt文档并设置指定网页内容为文档名的python程序

根据Excel表中提供的网址信息，打开对应的网页，抽取标题和文本内容，并存储到TXT中，python代码示例

用Python下载网页视频

python爬虫post请求怎么使用

帮我用python flask框架写一个读取 PDF 文件中的内容然后调用百度翻译api翻译为中文

如何使用Python爬取图片？

最新推荐

工业AI视觉检测解决方案.pptx

管理建模和仿真的文件

MySQL运维最佳实践：经验总结与建议

stata面板数据画图

智慧医院信息化建设规划及愿景解决方案.pptx

"互动学习：行动中的多样性与论文攻读经历"

MySQL监控与预警：故障预防与快速响应

C语言MAKEU32函数

智慧医院信息化+智能化系统建设方案.pptx

关系数据表示学习