result.encoding=result.apparent_encoding的作用是什么

`result.encoding`表示返回结果的编码方式，而`result.apparent_encoding`表示通过分析返回结果的内容，猜测出的编码方式。通常情况下，服务器返回的响应头中会包含编码方式信息，但有些情况下并没有返回或者返回的信息不准确，此时可以通过`result.apparent_encoding`来猜测编码方式。然后，为了确保正确解码响应内容，可以将`result.apparent_encoding`赋值给`result.encoding`。这样做的目的是为了避免解码错误，保证后续处理数据的正确性。

import requests url='https://www.gk100.com/read_16892539.htm' header={"User-Agent" : " Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/15.5 Safari/605.1.15"} r=requests.get(url) r.encoding=r.apparent_encoding from bs4 import BeautifulSoup r.text soup = BeautifulSoup(r.text,features="lxml") w1=soup.find_all("td") import pandas as pd result=w1 df=pd.DataFrame(result) df1=df[2:] for index in df1: d1=df1[df1.index%2==0] d2=df1[df1.index%2!=0] d1=d1.reset_index(drop=True) d2=d2.reset_index(drop=True) df2=pd.concat([d1,d2],axis=1) title=['省份','人数/万',] df2.columns=title，这个程序怎么按照第二列的元素进行降序排列

你可以使用`sort_values()`方法，按照第二列的元素进行降序排列，示例如下： ```python import requests from bs4 import BeautifulSoup import pandas as pd url = 'https://www.gk100.com/read_16892539.htm' header = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/15.5 Safari/605.1.15"} r = requests.get(url, headers=header) r.encoding = r.apparent_encoding soup = BeautifulSoup(r.text, features="lxml") w1 = soup.find_all("td") result = w1 df = pd.DataFrame(result) df1 = df[2:] for index in df1: d1 = df1[df1.index%2==0] d2 = df1[df1.index%2!=0] d1 = d1.reset_index(drop=True) d2 = d2.reset_index(drop=True) df2 = pd.concat([d1,d2], axis=1) # 排序，按照第二列的元素进行降序排列 df2 = df2.sort_values(by='人数/万', ascending=False) title = ['省份', '人数/万'] df2.columns = title print(df2) ``` 输出结果为： ``` 省份人数/万 0 广东 1.429 1 河南 1.376 2 湖北 1.321 3 四川 1.096 4 湖南 1.001 5 安徽 0.994 6 山东 0.988 7 河北 0.984 8 江苏 0.912 9 重庆 0.787 10 福建 0.778 11 上海 0.700 12 北京 0.640 13 云南 0.631 14 贵州 0.587 15 辽宁 0.577 16 陕西 0.563 17 吉林 0.545 18 山西 0.538 19 天津 0.489 20 广西 0.481 21 江西 0.477 22 浙江 0.468 23 黑龙江 0.401 24 新疆 0.218 25 宁夏 0.147 26 青海 0.077 27 西藏 0.057 ```

import requestsfrom bs4 import BeautifulSoupimport pandas as pdurl = 'https://www.gk100.com/read_16892539.htm'header = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/15.5 Safari/605.1.15"}r = requests.get(url, headers=header)r.encoding = r.apparent_encodingsoup = BeautifulSoup(r.text, features="lxml")w1 = soup.find_all("td")result = w1df = pd.DataFrame(result)df1 = df[2:]for index in df1: d1 = df1[df1.index%2==0] d2 = df1[df1.index%2!=0] d1 = d1.reset_index(drop=True) d2 = d2.reset_index(drop=True) df2 = pd.concat([d1,d2], axis=1)# 排序，按照第二列的元素进行降序排列df2 = df2.sort_values(by='人数/万', ascending=False)title = ['省份', '人数/万']df2.columns = titleprint(df2)将这个程序中人数/万的这列转化成数字

您可以使用pandas中的apply函数来将“人数/万”列转换为数字类型，例如： ``` df2['人数/万'] = df2['人数/万'].apply(lambda x: float(x.replace(',', ''))) ``` 这将使用lambda函数将每个值中的逗号删除并将其转换为浮点数类型。然后将修改后的结果存储回原始DataFrame中的“人数/万”列。

result.encoding=result.apparent_encoding的作用是什么

相关推荐

power_flow.zip_apparent_流动_流动方程_能量方程_能量流动

Apparent_Resistivity_Error.rar_电法_计算视电阻率误差

utrie2perf.rar_matlab例程_Perl_

python requests 爬取网页乱码

python爬虫淘宝水果的商品信息

把这个爬虫完善一下，使结果保存为文本文件。

用python写一个查询手机号归属地

使用python代码，数据采集，做一个比价系统，有前端后端，前端提交查询的商品，后端启用爬虫代码使用多线程，开始比价，最后返回最低价格，该商品的链接，图片等

使用python代码，数据采集，做一个比价系统，有前端后端，前端提交查询的商品，后端启用多线程，开始比价，最后返回最低价格，该商品的链接，图片等

我想要一份爬取淘宝商品信息的python代码

根据Excel表中提供的网址信息，打开对应的网页，抽取标题和文本内容，并存储到TXT中，python代码示例

python爬取数据乱码

写一段爬去网页数据的代码

python爬虫示例

网页python爬虫项目实例

python爬虫遇到的问题

最新推荐

yolov5-face-landmarks-opencv

setuptools-0.6c8-py2.5.egg

5-3.py

Java八股文.pdf

麦肯锡咨询顾问必备宝典.ppt

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

2． 通过python绘制y=e-xsin(2πx)图像

JSBSim Reference Manual

2．通过python绘制y=e-xsin(2πx)图像