# -- coding: utf-8 -- import urllib.request import re def getNovertContent(): url = 'http://www.quannovel.com/read/640/' req = urllib.request.Request(url) req.add_header('User-Agent', ' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36') data = urllib.request.urlopen(req).read().decode('gbk') str1 = str(data) # 将网页数据转换为字符串 reg = r'<li><a href="(.*?)" title=".*?">(.*?)</a><li>' reg = re.compile(reg) urls = reg.findall(str1) for url in urls: novel_url = url[0] novel_title = url[1] chapt = urllib.request.urlopen(novel_url).read() chapt_html = chapt.decode('gbk') reg = r'</script>    (.*?)</script type="text/javascript">' reg = re.compile(reg, re.S) chapt_content = reg.findall(chapt_html) chapt_content = chapt_content[0].replace( "    ", "") chapt_content = chapt_content.replace("<br />", "") print("正在保存 %s" % novel_title) with open("{}.txt".format(novel_title), 'w', encoding='utf-8') as f: f.write(chapt_content) getNovertContent()

下面代码运行后文档内只有标题，没有内容，请帮我找一下原因 # -- coding: utf-8 -- import urllib.request import re import pandas as pd import time def getdata(url): req = urllib.request.Request(url) req.add_header('User-Agent', ' Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36') data = urllib.request.urlopen(req).read().decode('utf-8') str1 = str(data) pat = ''' (.?) (.?) (.?) (.?) .? ''' result = re.compile(pat).findall(str1) return result if name == 'main': for i in range(2018, 2020): print('正在收集第%d年数据' % i) rank = [] country = [] zhou = [] total = [] url = 'https://www.kuaiyilicai.com/stats/global/yearly/g_gdp/' + str(i) + '.html' data = getdata(url) for j in range(0, len(data)): rank.append(data[j][0]) country.append(data[j][1]) zhou.append(data[j][2]) total.append(data[j][3]) dataframe = pd.DataFrame({'排名': rank, '国家/地区': country, '所在洲': zhou, 'GDP(美元计)': total}) with open(str(i) + "年世界gdp排名.csv", mode="w", encoding="utf_8_sig") as f: dataframe.to_csv(f, index=False, sep=',') print(i, '年数据收集完成')

这个代码的问题可能是在正则表达式的匹配上。你可以把这一行代码： pat = '''<tr> (.*?)</td> (.*?)</td> (.*?)</td> (.*?)</td> <td>.?</td> </tr>''' ...原因是因为在该网页中，每一行的最后一个数据被包含在了 ...

这段代码是干什么用的# -- coding: utf-8 -- import time import uuid import hashlib import base64 import ssl import urllib.request import hmac from hashlib import sha256 # 必填,请参考"开发准备"获取如下数据,替换为实际值 realUrl = 'https://rtcpns.cn-north-1.myhuaweicloud.com/rest/caas/relationnumber/partners/v1.0' #APP接入地址+接口访问URI APP_KEY = "a1****" #APP_Key APP_SECRET = "cfc8" #APP_Secret ''' 选填,各参数要求请参考"AXB模式解绑接口" subscriptionId和relationNum为二选一关系,两者都携带时以subscriptionId为准 ''' subscriptionId = '' #指定"AXB模式绑定接口"返回的绑定ID进行解绑 relationNum = '+861700001' #指定X号码(隐私号码)进行解绑 def buildAKSKHeader(appKey, appSecret): now = time.strftime('%Y-%m-%dT%H:%M:%SZ') #Created nonce = str(uuid.uuid4()).replace('-','') #Nonce digist = hmac.new(appSecret.encode(), (nonce + now).encode(), digestmod=sha256).digest() digestBase64 = base64.b64encode(digist).decode() #PasswordDigest return 'UsernameToken Username="{}",PasswordDigest="{}",Nonce="{}",Created="{}"'.format(appKey, digestBase64, nonce, now); def main(): # 请求URL参数 formData = urllib.parse.urlencode({ 'subscriptionId':subscriptionId, 'relationNum':relationNum }) #完整请求地址 fullUrl = realUrl + '?' + formData req = urllib.request.Request(url=fullUrl, method='DELETE') #请求方法为DELETE # 请求Headers参数 req.add_header('Authorization', 'AKSK realm="SDP",profile="UsernameToken",type="Appkey"') req.add_header('X-AKSK', buildAKSKHeader(APP_KEY, APP_SECRET)) req.add_header('Content-Type', 'application/json;charset=UTF-8') # 为防止因HTTPS证书认证失败造成API调用失败,需要先忽略证书信任问题 ssl._create_default_https_context = ssl._create_unverified_context try: print(formData) #打印请求数据 r = urllib.request.urlopen(req) #发送请求 print(r.read().decode('utf-8')) #打印响应结果 except urllib.error.HTTPError as e: print(e.code) print(e.read().decode('utf-8')) #打印错误信息 except urllib.error.URLError as e: print(e.reason) if name == 'main': main()

这段代码实现的是使用 Python 发送一个 DELETE 请求，访问华为云服务...同时，代码中使用了 urllib 库来进行 HTTP 请求的发送和处理，这是 Python 标准库中自带的 HTTP 请求库，支持多种 HTTP 请求方法和数据传输方式。

#!/usr/local/bin/python3 # -- coding: utf-8 -- # @Time : 2023/6/11 14:19 # @Author : 志在星空 # @File : jietu12.py # @Software: PyCharm import base64 import urllib import requests import json API_KEY = "jHxdMDf2bhEPxcG6zFoRUejo" SECRET_KEY = "QF5GO9eLQncG2Zr1MKrxLOWvKAkAtVfI" def main(): # 发送 OCR 请求并获取响应 url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general?access_token=" + get_access_token() # payload = 'image=%2F9j%2F4AAQ' headers = { 'Content-Type': 'application/x-www-form-urlencoded', 'Accept': 'application/json' } image_path = "11.jpg" with open(image_path, "rb") as image_file: image_data = image_file.read() response = requests.post(url, headers=headers, data=image_data) # response = requests.request("POST", url, headers=headers, data=payload) # 解析响应并提取 words_result 中的所有 words 字段 result = json.loads(response.text) print(result) # words_list = [item['words'] for item in result['words_result']] # print(words_list) # # # 打印所有提取到的内容 # for words in words_list: # print(words) def get_file_content_as_base64(path, urlencoded=False): """ 获取文件base64编码 :param path: 文件路径 :param urlencoded: 是否对结果进行urlencoded :return: base64编码信息 """ with open(path, "rb") as f: content = base64.b64encode(f.read()).decode("utf8") if urlencoded: content = urllib.parse.quote_plus(content) return content def get_access_token(): """ 使用 AK，SK 生成鉴权签名（Access Token） :return: access_token，或是None(如果错误) """ url = "https://aip.baidubce.com/oauth/2.0/token" params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY} return str(requests.post(url, params=params).json().get("access_token")) if name == 'main': main()运行出现{'log_id': 1667825949995168966, 'error_msg': 'param image not exist', 'error_code': 216101}，怎么办

根据API的响应信息，错误信息为"param image not exist"，也就是说API无法找到你指定的图片文件。请确保文件路径是正确的，并且文件名和扩展名的大小写与实际文件匹配。如果文件名或路径错误，将导致API无法找到该...

#!/usr/local/bin/python3 # -- coding: utf-8 -- # @Time : 2023/6/11 14:19 # @Author : 志在星空 # @File : jietu12.py # @Software: PyCharm import base64 import urllib import requests import json API_KEY = "jHxdMDf2bhEPxcG6zFoRUejo" SECRET_KEY = "QF5GO9eLQncG2Zr1MKrxLOWvKAkAtVfI" def main(): # 发送 OCR 请求并获取响应 url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general?access_token=" + get_access_token() # payload = 'image=%2F9j%2F4AAQ' headers = { 'Content-Type': 'application/x-www-form-urlencoded', 'Accept': 'application/json' } image_path = "11.jpg" with open(image_path, "rb") as image_file: image_data = image_file.read() response = requests.post(url, headers=headers, data=image_data) # response = requests.request("POST", url, headers=headers, data=payload) # 解析响应并提取 words_result 中的所有 words 字段 result = json.loads(response.text) print(result) # words_list = [item['words'] for item in result['words_result']] # print(words_list) # # # 打印所有提取到的内容 # for words in words_list: # print(words) def get_file_content_as_base64(path, urlencoded=False): """ 获取文件base64编码 :param path: 文件路径 :param urlencoded: 是否对结果进行urlencoded :return: base64编码信息 """ with open(path, "rb") as f: content = base64.b64encode(f.read()).decode("utf8") if urlencoded: content = urllib.parse.quote_plus(content) return content def get_access_token(): """ 使用 AK，SK 生成鉴权签名（Access Token） :return: access_token，或是None(如果错误) """ url = "https://aip.baidubce.com/oauth/2.0/token" params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY} return str(requests.post(url, params=params).json().get("access_token")) if name == 'main': main()运行出现{'log_id': 1667825949995168966, 'error_msg': 'param image not exist', 'error_code': 216101}，请修改一下

return str(requests.post(url, params=params).json().get("access_token")) if __name__ == '__main__': headers = { 'Content-Type': 'multipart/form-data', 'Accept': 'application/json' } main() ...

python3使用urllib示例取googletranslate(谷歌翻译)

复制代码代码如下:#!/usr/bin/env python3# -*- coding: utf-8 -*-# File Name : gt1.py#...import urllib.requestimport sys typ = sys.getfilesystemencoding() def translate(querystr, to_l=”zh”, from_l=”en”

python获取url的返回信息方法

# -*- coding: utf-8 -*- import os import sys import urllib import urllib2 import string #########start 获取url的返回信息############ def jwkj_url_postget(url,vlaues): data = urllib.urlencode(values) ...

Python解析、提取url关键字的实例详解

import urllib.request #### 四、提取关键字的方法根据文章提供的代码示例，我们可以总结出提取关键字的通用方法。这里主要分为两种情况： 1. **使用等号连接的关键字**：这类关键字通常出现在查询参数中...

weather.exe

#coding=utf-8 import json import urllib.request import time import traceback #模拟成浏览器 headers={"Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8", ...

Python网络编程案例：urllib.request如何优雅发送POST请求

![python库文件学习之urllib.request](https://img-blog.csdnimg.cn/direct/1cca2cb5dd59411783b87d9c542d7b58.png) # 1. Python网络编程概述 ...通过Python，开发者可以利用其强大的库，如urllib.request和so

【掌握lxml.etree核心技巧】：高级使用方法与最佳实践

[lxml.etree](https://opengraph.githubassets.com/d6cfbd669f0a485650dab2da1de2124d37f6fd630239394f65828a38cbc8aa82/lxml/lxml) # 1. 掌握lxml.etree核心技巧 ## 1.1 lxml.etree简介 lxml是一个非常强大的库，...

【httplib进阶指南】：自定义HTTP请求，提升响应处理效率

[【httplib进阶指南】：自定义HTTP请求，提升响应处理效率](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/e97fc0e60a884139b544cdf5ee0b0cba~tplv-k3u1fbpfcp-zoom-in-crop-mark:1512:0:0:0.awebp) ...

基于freeRTOS和STM32F103x的手机远程控制浴室温度系统设计源码

该项目是一款基于freeRTOS操作系统和STM32F103x微控制器的手机远程控制浴室温度系统设计源码，共包含1087个文件，包括580个C语言源文件、269个头文件、45个汇编源文件、36个数据文件、36个目标文件、35个编译规则文件、28个包含文件、27个文本文件、6个源文件、3个归档文件。此系统通过手机远程实现对浴室温度的有效控制，适用于智能浴室环境管理。

相关推荐

python-poster:数组发布支持的python海报

python使用urllib2提交http post请求的方法

Python从ZabbixAPI获取信息及实现Zabbix-API 监控的方法

python3使用urllib示例取googletranslate(谷歌翻译)

python获取url的返回信息方法

Python解析、提取url关键字的实例详解

weather.exe

Python网络编程案例：urllib.request如何优雅发送POST请求

【掌握lxml.etree核心技巧】：高级使用方法与最佳实践

【httplib进阶指南】：自定义HTTP请求，提升响应处理效率

基于freeRTOS和STM32F103x的手机远程控制浴室温度系统设计源码

最新推荐

基于freeRTOS和STM32F103x的手机远程控制浴室温度系统设计源码

LABVIEW程序实例-web写数据.zip

LABVIEW程序实例-前面板对象常用属性.zip

LABVIEW程序实例-通过全局变量发送数据.zip

LABVIEW程序实例-数组大小.zip

Windows平台下的Fastboot工具使用指南

管理建模和仿真的文件

DLMS规约深度剖析：从基础到电力通信标准的全面掌握

修改代码，使其正确运行

Python机器学习基础入门与项目实践