要求写一段Python代码,是从指定的百度贴吧链接http://tieba.baidu.com/p/4194772383?pn=中提取出所有符合电子邮箱格式的字符串,并将它们写入到一个名为"D:\tb.txt"的文件中。
时间: 2024-09-09 14:02:50 浏览: 26
为了完成这个任务,我们需要使用Python进行网络请求以获取贴吧页面内容,然后利用正则表达式来匹配电子邮箱格式的字符串。最后,将匹配到的电子邮箱写入指定的文件。下面是一个简单的示例代码:
```python
import re
import requests
# 百度贴吧链接
url = "http://tieba.baidu.com/p/4194772383?pn="
# 发送HTTP请求获取页面内容
response = requests.get(url)
# 确保请求成功
if response.status_code == 200:
# 使用正则表达式匹配电子邮箱格式
pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
# 寻找所有匹配的邮箱
emails = re.findall(pattern, response.text)
# 打开文件,准备写入
with open("D:\\tb.txt", "w", encoding='utf-8') as file:
# 遍历所有匹配的邮箱并写入文件
for email in emails:
file.write(email + "\n")
else:
print("请求失败,状态码:", response.status_code)
```
在使用上述代码之前,请确保你的Python环境中已安装了`requests`库。如果未安装,可以通过执行`pip install requests`来安装。