帮我写一个python脚本爬取指定网页中的IP
时间: 2023-06-06 17:08:40 浏览: 106
当然,我可以帮您解决这个问题。您需要使用Python中的requests和BeautifulSoup库来实现这个功能。以下是一个示例代码:
```python
import requests
from bs4 import BeautifulSoup
url = "http://www.example.com" # 指定网页的URL地址
response = requests.get(url) # 发送HTTP请求
soup = BeautifulSoup(response.text, "html.parser") # 解析HTML页面
ips = []
# 在页面中查找所有的IP地址
for tag in soup.find_all("a"):
if tag.get("href") and tag.get("href").startswith("http") and ":" in tag.get("href"):
ip = tag.get("href").split(":")[0]
if ip not in ips:
ips.append(ip)
# 打印所有的IP地址
for ip in ips:
print(ip)
```
您只需要将`url`变量替换为您要爬取的网页的URL地址即可。该脚本会自动查找所有的IP地址并将其打印出来。
相关问题
帮我写一个python脚本爬取指定网页中的IP并把输出结果保存到1.txt中
当然,我可以帮你实现这个功能。以下是Python脚本代码:
```python
import re
import requests
url = "指定网页的URL链接"
html = requests.get(url).text
pattern = r"\d+\.\d+\.\d+\.\d+"
ip_list = re.findall(pattern, html)
with open("1.txt", "w") as f:
for ip in ip_list:
f.write(ip + "\n")
```
请将 "指定网页的URL链接" 修改为你想要爬取IP地址的具体网页链接。此外,运行程序后,爬取结果将保存到当前目录下的1.txt文件中。
帮我写一个python脚本爬取指定网页中的IP及端口并把输出结果保存到1.txt中
当然,我可以帮你写一个Python脚本来爬取指定网页中的IP及端口,并将输出结果保存到1.txt中。以下是示例代码:
```python
import requests
from bs4 import BeautifulSoup
url = "https://www.example.com" # 将网页地址替换为你需要爬取的网页地址
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
ip_ports = []
# 在这里添加解析网页代码,获取IP及端口,将它们存储为字符串列表 ip_ports
with open("1.txt", "w") as f:
f.write("\n".join(ip_ports))
```
需要注意的是,这只是一个示例代码,实际的网页代码可能会比较复杂,需要根据具体的情况进行调整。另外,爬取网页可能会破坏该网站的服务协议,因此在实际操作中需要注意遵守相关法律法规。
阅读全文