用正则表达式提取文本中的关键词。如“顺利打开JFK深刻理解","www.baidu.com","www.youku.com","开始就立刻搭街坊率领的科技","。 目标1:通过正则把域名提取出来 目标2:把结果输出成表格或txt
时间: 2023-11-21 13:17:02 浏览: 163
正则表达式提取网址、标题、图片等一例(.Net Asp Javascript/Js)的实现
可以使用Python中的re模块来进行正则表达式的匹配和提取。
以下是一个示例代码,用于提取文本中的域名并将结果输出到txt文件中:
```
import re
text = "顺利打开JFK深刻理解,www.baidu.com,www.youku.com,开始就立刻搭街坊率领的科技。"
# 使用正则表达式提取域名
pattern = r"(?P<url>www\.[\w\.]+)"
urls = re.findall(pattern, text)
# 将结果输出到txt文件中
with open("output.txt", "w") as f:
f.write("Domain Name\n")
for url in urls:
f.write(url + "\n")
```
解释一下代码:
1. 定义了一个字符串`text`,其中包含了需要提取域名的文本。
2. 使用正则表达式`"(?P<url>www\.[\w\.]+)"`来匹配文本中的域名。其中,`(?P<url>...)`表示将匹配结果命名为`url`,`www\.[\w\.]+`表示匹配以`www.`开头,后面跟着一个或多个字母、数字、点号(`.`)或下划线(`\w`)的字符串。
3. 使用`re.findall()`函数来查找文本中所有匹配的结果,并将结果存储在列表`urls`中。
4. 使用`with open() as f:`语句来打开一个文件,将结果输出到文件中。`"output.txt"`表示输出文件的文件名,`"w"`表示以写入模式打开文件。在`with`语句块中,先写入表头`Domain Name`,然后遍历`urls`列表,将每个域名写入文件中。
输出的txt文件内容如下:
```
Domain Name
www.baidu.com
www.youku.com
```
阅读全文