用python爬取字符串并比对
时间: 2024-09-26 14:09:29 浏览: 6
在Python中,你可以使用`requests`库来发送HTTP请求获取网页内容,然后使用`BeautifulSoup`或`re`模块解析HTML提取你需要的字符串。这里是一个基本示例,假设你想从网页上抓取一段特定的文本并进行比较:
```python
import requests
from bs4 import BeautifulSoup
# 发送GET请求
url = 'https://www.example.com' # 替换为你需要爬取的网站
response = requests.get(url)
# 判断请求是否成功
if response.status_code == 200:
# 解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到你想要的目标字符串
target_text = soup.find('span', {'class': 'target-class'}) # 根据实际标签选择
if target_text:
# 提取文本
extracted_text = target_text.text
# 进行比较,这里只是一个简单的例子,可以根据需求调整比较逻辑
if extracted_text == '预期的字符串':
print(f"找到了目标字符串: {extracted_text}")
else:
print("目标字符串未找到")
else:
print("请求失败")