用python来实现,当http://192.168.20.137:6179/页面上<h2 id=“slate”>变化时,打印变化的<h2 id=“slate”>内容,不用BeautifulSoup
时间: 2024-09-10 21:15:33 浏览: 54
要实现这个功能,可以使用Python的`requests`库来发送HTTP请求,获取网页内容,以及`xml.etree.ElementTree`来解析HTML(虽然不是BeautifulSoup,但它是Python标准库中用于解析XML/HTML的模块)。以下是一个简单的实现步骤:
1. 使用`requests`库获取网页内容。
2. 解析获取到的HTML内容,定位到`<h2 id="slate">`元素。
3. 使用一个定时机制(例如`time.sleep()`)定时检查该元素内容的变化。
4. 当检测到内容变化时,打印新的内容。
下面是一个简单的示例代码:
```python
import requests
import time
from xml.etree import ElementTree
def get_html_content(url):
response = requests.get(url)
if response.status_code == 200:
return response.text
else:
return None
def parse_h2_content(html_content, element_id):
root = ElementTree.fromstring(html_content)
for h2 in root.findall('.//h2'):
if h2.attrib.get('id') == element_id:
return h2.text
return None
url = 'http://192.168.20.137:6179/'
interval = 5 # 检查间隔时间,单位秒
prev_content = ''
while True:
html_content = get_html_content(url)
if html_content:
h2_content = parse_h2_content(html_content, 'slate')
if h2_content and h2_content != prev_content:
print(f"变化了: {h2_content}")
prev_content = h2_content
else:
print("无法获取网页内容")
time.sleep(interval)
```
请注意,这个代码没有处理网络请求的异常和错误,也没有对HTML解析的异常进行处理,实际使用时需要增加相应的异常处理逻辑。此外,频繁地请求同一个资源可能会给服务器造成不必要的压力,因此应当合理设置检查间隔。
阅读全文