import requests from bs4 import BeautifulSoup url ="http://170.106.117.230/?url=steam://rungame/730/76561202255233023/+csgo_econ_action_preview%20M4339827378402747041A30648261933D3039437502918428834" headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36'} response = requests.get(url, headers=headers) print('状态码:', response.status_code) print('响应体:', response.text) soup = BeautifulSoup(response.text, 'html.parser') # 找到特定的标签或者CSS选择器 # 打印提取的数据 floatvalue_tag = soup.find('iteminfo') if floatvalue_tag: data = floatvalue_tag.text print(data) else: print('未找到 floatvalue 标签')
时间: 2024-04-23 13:24:37 浏览: 26
这段代码是用 Python 语言编写的,主要利用 requests 库向指定的 URL 发送 GET 请求,获取网页内容,然后使用 BeautifulSoup 库解析 HTML 文本,并从中找到一个名为 "iteminfo" 的标签,提取出它的文本内容并打印出来。这个网址似乎是一个 Steam 游戏的链接,但是在请求时经过了一个代理服务器。
相关问题
import requests from bs4 import BeautifulSoup url ="http://170.106.117.230/?url=steam://rungame/730/76561202255233023/+csgo_econ_action_preview%20M4339827378402747041A30648261933D3039437502918428834" headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36'} response = requests.get(url, headers=headers) print('状态码:', response.status_code) print('响应体:', response.text) soup = BeautifulSoup(response.text, 'html.parser') # 找到特定的标签或者CSS选择器 data = soup.find('div', {'class': 'floatvalue'}).text # 打印提取的数据 print(soup )怎么提取floatbalue
可以使用 BeautifulSoup 的 `find` 或 `find_all` 方法来查找特定的标签或 CSS 选择器,并使用 `text` 属性来获取标签中的文本内容。在这个例子中,可以使用以下代码来提取 `floatvalue`:
```
data = soup.find('div', {'class': 'floatvalue'}).text
print(data)
```
这会在 HTML 中查找 `class` 属性为 `floatvalue` 的 `div` 标签,并将其文本内容提取出来。
修改代码,使得li_list的编码格式是utf-8import requests from bs4 import BeautifulSoup url = 'https://www.icbc.com.cn/page/827855918799994880.html' response = requests.get(url=url) page_response = response.text soup = BeautifulSoup(page_response, 'html.parser',from_encoding='utf-8') li_list = soup.select('#mypagehtmlcontent p')
import requests
from bs4 import BeautifulSoup
url = 'https://www.icbc.com.cn/page/827855918799994880.html'
response = requests.get(url=url)
page_response = response.content.decode('utf-8')
soup = BeautifulSoup(page_response, 'html.parser')
li_list = soup.select('#mypagehtmlcontent p')
# 以下为测试代码,可以不用理会
for li in li_list:
print(li.text)
阅读全文