编写程序实现以下功能:利用正则表达式得到一段HTML文本中所有超链接对应的网址,并将网址输出到屏幕上(每行输出一个网址)。 输入格式: 从键盘输入 一段HTML文本,多行输入,空行输入 结束。
时间: 2024-10-04 18:01:25 浏览: 110
你可以使用Python的`re`模块来编写这样的程序。下面是一个简单的示例:
```python
import re
def extract_links(html_text):
# 定义正则表达式匹配URL
url_pattern = r'(https?|ftp):\/\/[\w/\-?=%.]+\.[\w/\-?=%.]+'
# 使用re.findall找到所有的URL并存储在列表中
links = re.findall(url_pattern, html_text)
# 遍历链接并打印
for link in links:
print(link)
# 获取用户输入的HTML文本
html_input = ''
while True:
line = input()
if not line.strip():
break
html_input += line + '\n'
# 调用函数提取并打印链接
extract_links(html_input)
```
这个程序会持续从用户那里接收输入,直到遇到一个空行为止。它会在每次输入后查找并打印出HTML文本中所有的有效URL。
阅读全文