使用Requests库向网站“便民查询网” https://changyongdianhuahaoma.bmcx.com//发送请求,爬取常用电话号码内容。 具体说明如下: (1) 使用正则表达式解析页面
时间: 2024-10-11 12:07:19 浏览: 37
在Python中,你可以使用`requests`库发起HTTP GET请求获取网页内容,并利用`BeautifulSoup`库解析HTML文档来提取所需信息。以下是使用`requests`和`re`(正则表达式)的一个示例:
首先,你需要安装必要的库,如果尚未安装,可以使用pip命令安装:
```bash
pip install requests beautifulsoup4
```
然后,你可以编写如下的Python代码来实现你的需求:
```python
import requests
from bs4 import BeautifulSoup
import re
# 发送GET请求
url = "https://changyongdianhuahaoma.bmcx.com/"
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 正则表达式查找电话号码,这里假设电话号码在特定的格式下,比如"010-12345678"
phone_pattern = r'\b\d{3}-\d{8}\b'
# 找到所有匹配的电话号码
phone_numbers = re.findall(phone_pattern, str(soup))
# 输出找到的电话号码
for number in phone_numbers:
print(number)
else:
print("请求失败,状态码:", response.status_code)
阅读全文