使用BeautifulSoup库解析过程显示runfile('/Users/mac/.spyder-py3/temp.py', wdir='/Users/mac/.spyder-py3')是为什么

runfile('/Users/mac/.spyder-py3/temp.py', wdir='/Users/mac/.spyder-py3') 是 Spyder IDE 的输出，它通常会在 Spyder 控制台中显示，表示 Python 解释器已经执行了代码文件 /Users/mac/.spyder-py3/temp.py。在这个例子中，代码文件中包含了使用 BeautifulSoup 库解析网页的代码。所以当解析过程完成后，控制台会显示 runfile('/Users/mac/.spyder-py3/temp.py', wdir='/Users/mac/.spyder-py3')。这是 Spyder IDE 提供的一种提示，告诉用户代码已经执行完毕。

输出报错runcell(0, '/Users/mac/??????.py') Traceback (most recent call last): File ~/anaconda3/lib/python3.10/site-packages/spyder_kernels/py3compat.py:356 in compat_exec exec(code, globals, locals) File ~/??????.py:36 df2=df2.sort_values(by='??/?',ascending=False) File ~/anaconda3/lib/python3.10/site-packages/pandas/util/_decorators.py:331 in wrapper return func(*args, **kwargs) File ~/anaconda3/lib/python3.10/site-packages/pandas/core/frame.py:6912 in sort_values k = self._get_label_or_level_values(by, axis=axis) File ~/anaconda3/lib/python3.10/site-packages/pandas/core/generic.py:1850 in _get_label_or_level_values raise KeyError(key) KeyError: ‘人数/万’，重新修改一下这个程序

根据错误信息看来，出现了KeyError异常，即没有找到名为'人数/万'的列。你可以检查一下DataFrame是否包含该列，或者该列名是否拼写正确。另外，为了避免出现中文乱码问题，可以在文件开头添加如下代码，设置编码为UTF-8：

# -*- coding: utf-8 -*-

根据你提供的代码，修改后的程序如下：

# -*- coding: utf-8 -*-
import requests
from bs4 import BeautifulSoup
import pandas as pd

url = 'https://www.gk100.com/read_16892539.htm'
header = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/15.5 Safari/605.1.15"}

r = requests.get(url, headers=header)
r.encoding = r.apparent_encoding

soup = BeautifulSoup(r.text, features="lxml")
w1 = soup.find_all("td")

result = w1
df = pd.DataFrame(result)

df1 = df[2:]
for index in df1:
    d1 = df1[df1.index%2==0]
    d2 = df1[df1.index%2!=0]
    d1 = d1.reset_index(drop=True)
    d2 = d2.reset_index(drop=True)
    df2 = pd.concat([d1,d2], axis=1)

# 排序，按照第二列的元素进行降序排列
df2 = df2.sort_values(by='??/?', ascending=False)

title = ['省份', '人数/万']
df2.columns = title

print(df2)

需要注意的是，你的代码中by='??/?'的部分中文字符被替换成了问号，可能是文件编码不太兼容，你需要手动修改为正确的列名。

<li> <a href="https://2020.cctv.com/schedule/item/data/index.shtml?item=KMS-------------------------------"> <p><img src="//p1.img.cctvpic.com/sports/data/olympic/iconBlue/KMS-------------------------------.png"> </p> <p>开幕式</p> </a> </li> 如何用Beautifulsoup取到第二个p标签

可以使用 BeautifulSoup 的 find_all() 方法来获取页面中所有的 p 标签。你可以使用 find() 方法来获取第一个 p 标签或者 find_all() 方法的第二个元素来获取第二个 p 标签。

示例代码：

from bs4 import BeautifulSoup

# 使用 BeautifulSoup 解析 HTML
soup = BeautifulSoup(html, 'html.parser')

# 获取所有 p 标签
all_p = soup.find_all('p')

# 获取第一个 p 标签
first_p = all_p[0]

# 获取第二个 p 标签
second_p = all_p[1]

# 也可以使用 find() 方法获取第一个 p 标签，find_all() 的第二个元素获取第二个 p 标签
first_p = soup.find('p')
second_p = soup.find_all('p')[1]

希望这个答案能帮到你！

向AI提问

使用BeautifulSoup库解析过程显示runfile('/Users/mac/.spyder-py3/temp.py', wdir='/Users/mac/.spyder-py3')是为什么

<li> <a href="https://2020.cctv.com/schedule/item/data/index.shtml?item=KMS-------------------------------"> <p><img src="//p1.img.cctvpic.com/sports/data/olympic/iconBlue/KMS-------------------------------.png"> </p> <p>开幕式</p> </a> </li> 如何用Beautifulsoup取到第二个p标签

相关推荐

Python库 | types_beautifulsoup4-4.9.2-py3-none-any.whl

Python库 | ESD-0.0.15-py3-none-any.whl

Python库 | snipsskills-0.1.4.844-py2.py3-none-any.whl

开幕式 如何用Beautifulsoup取到开幕式

import requests from bs4 import BeautifulSoup url = 'http://itc.hzau.edu.cn/' response = requests.get(url) soup = BeautifulSoup(response.content, 'html.parser') tag = soup.find('li', class_='menu-item menu-item-type-custom menu-item-object-custom menu-item-764') link = tag.a['href'] print(link)

怎么爬取https://price.pcauto.com.cn/top/sales/s1-t3-y2022-m12.html和https://price.pcauto.com.cn/top/sales/s1-t3-y2021-m12.html中的表格

用BeautifulSoup实现对http://news.imnu.edu.cn/的爬取

如何使用XPath和BeautifulSoup库分别解析'http://www.gdpt.edu.cn'网站的首页，获取并打印其水平导航菜单栏的所有文字？

利用beautifulsoup4爬取网页http://vip.stock.finance.sina.com.cn/corp/go.php/vFD_BalanceSheet/stockid/000568/ctrl/part/displaytype/4.phtml中BalanceSheetNewTable0 > tbody表格的内容并利用panda库将其内容存储到excel表格中

使用Python爬取http://www.lube-info.com/2017/1221/6642.html网页内容

爬取http://www.cdt-kxjs.com/scientific/research/14972.html

from urllib.request import urlopen#用于获取网页 from bs4 import BeautifulSoup#用于解析网页 html = urlopen('https://baike.pcbaby.com.cn/') bsObj = BeautifulSoup(html, 'html.parser') #//div[@id="Jbaike"]//div/dl/dd//@href t1 = bsObj.select('a') for t2 in t1: t3 = t2.get('href') print(t3)

https://manu44.magtech.com.cn/Jwk_infotech_wk3/article/2023/2096-3467/2096-3467-7-4-145.shtml 获取网页的文本内容

获取https://www.personality-database.com/profile?pid=2&cid=27&sort=hot的网页元素

我想用jupyter notebook来读取https://www.the-afc.com/en/more/afc_ranking.html这个网站的数据，具体代码是什么呢

使用requests库及BeautifulSoup库爬取https://www.shanghairanking.cn/rankings/bcur/2023网站前20名高校信息，按照以下格式输出

大家在看

netcore-net8支持linux的验证码verifycode-imagesharp

RTL8197F_Datasheet-V3.2.pdf

ADS函数大全

Adobe_Flash_Player_ActiveX_v34_0_0_211

AUTOSAR-MCAL -CanDriver-UserMAnnual

最新推荐

hiddenite-shops：Minecraft Bukkit商店交易插件

【SSM框架快速入门】

项目环境搭建及系统使用说明用例

Windows Media Encoder 64位双语言版发布

【IEEE 14总线系统Simulink模型：从零到专家的终极指南】：构建、仿真及故障诊断

树莓派改中文

SenseLock精锐IV C# API使用与代码示例教程

深入理解PgSQL绿色版：揭秘其优势与五大应用案例

ubuntu开机pcie bus error刷屏

RubyInstaller.zip: Windows平台Ruby安装方案

开幕式如何用Beautifulsoup取到开幕式