首页使用Requests库向网站“便民查询网” https://changyongdianhuahaoma.bmcx.com//发送请求，爬取常用电话号码内容。具体说明如下：（1）使用正则表达式解析页面

使用Requests库向网站“便民查询网” https://changyongdianhuahaoma.bmcx.com//发送请求，爬取常用电话号码内容。具体说明如下：（1）使用正则表达式解析页面

时间: 2024-10-11 14:07:19 浏览: 52

在Python中，你可以使用`requests`库发起HTTP GET请求获取网页内容，并利用`BeautifulSoup`库解析HTML文档来提取所需信息。以下是使用`requests`和`re`（正则表达式）的一个示例：首先，你需要安装必要的库，如果尚未安装，可以使用pip命令安装： ```bash pip install requests beautifulsoup4 ``` 然后，你可以编写如下的Python代码来实现你的需求： ```python import requests from bs4 import BeautifulSoup import re # 发送GET请求 url = "https://changyongdianhuahaoma.bmcx.com/" response = requests.get(url) # 检查请求是否成功 if response.status_code == 200: # 解析网页内容 soup = BeautifulSoup(response.text, 'html.parser') # 正则表达式查找电话号码，这里假设电话号码在特定的格式下，比如"010-12345678" phone_pattern = r'\b\d{3}-\d{8}\b' # 找到所有匹配的电话号码 phone_numbers = re.findall(phone_pattern, str(soup)) # 输出找到的电话号码 for number in phone_numbers: print(number) else: print("请求失败，状态码:", response.status_code)

阅读全文