data_response = requests.get(i)的编码是'ISO-8859-1',怎么转换为中文观看
时间: 2024-03-04 09:48:05 浏览: 58
可以使用Python中的encode()和decode()方法来进行编码转换。假设data_response是一个requests库获取的网页响应对象,其编码为'ISO-8859-1',需要将其内容转换为中文观看,可以使用以下代码:
```
data_response.encoding = 'ISO-8859-1' # 将响应编码设置为'ISO-8859-1'
content = data_response.content.decode('utf-8') # 将响应内容解码为utf-8编码的字符串
print(content) # 打印输出结果
```
其中,将响应对象的编码设置为'ISO-8859-1',然后使用content属性获取响应内容,并将其解码为utf-8编码的字符串,最后打印输出即可。如果需要将字符串保存到文件中,可以使用以下代码:
```
with open('filename.txt', 'w', encoding='utf-8') as f:
f.write(content)
```
其中,'filename.txt'是保存文件的文件名,'w'表示以写入模式打开文件,'utf-8'表示使用utf-8编码进行文件写入。
相关问题
import requests import parsel headers = { 'Referer': 'https://www.ximalaya.com/', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36 Edg/113.0.1774.35' } def download_one_music(song_id, name): api_url = 'https://www.ximalaya.com/revision/play/v1/audio?id='+song_id+'&ptype=1' response = requests.get(api_url, headers=headers) src = response.json()['data']['src'] print(src) response = requests.get(src,headers=headers) print(response) with open(name + '.m4a',mode='wb')as f: f.write(response.content) response = requests.get('https://www.ximalaya.com/album/68559551',headers=headers) html =response.text selector = parser.Selector(html) lis = selector.css('li._nO') for li in lis: title = li.css('div.text._nO a::attr(title)').get() href = li.css('div.text._nO a::attr(title)').get() song_id = href.split('/')[-1] print(song_id,title)
这段代码是一个Python脚本,用于从喜马拉雅网站下载音乐。代码中使用了requests和parsel库,headers中设置了请求头信息。其中,download_one_music函数是用于下载单个音乐的,通过传入歌曲ID和名称来进行下载。该函数中首先通过API接口获取到音乐的下载地址src,然后再通过requests库进行下载,最后将文件保存到本地。代码中还使用了循环遍历li元素,通过CSS选择器获取到每个音乐的ID和名称,从而进行批量下载。需要注意的是,这种爬取方式可能会违反喜马拉雅网站的规定和法律法规,建议在遵守相关法律法规的前提下使用。
import requests import re url = 'https://jn.lianjia.com/zufang/pg1/#contentList' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299' } # 获取总页数 response = requests.get(url, headers=headers) html = response.text total_page = re.search(r'data-totalpage="(\d+)"', html).group(1) print(total_page)将total_page变成int型
你可以使用 `int()` 函数将字符串类型的 `total_page` 转换成整数类型。
以下是修改后的示例代码:
```python
import requests
import re
url = 'https://jn.lianjia.com/zufang/pg1/#contentList'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299'
}
# 获取总页数
response = requests.get(url, headers=headers)
html = response.text
total_page = int(re.search(r'data-totalpage="(\d+)"', html).group(1))
print(total_page)
```
这个示例代码可以获取济南市链家网租房信息的总页数,并将其转换成整数类型。你可以根据自己的需要修改代码,提取其他信息。
阅读全文
相关推荐

















