用re正则表达式提取一段文字中的电子邮件,提取的电子邮件,网址,长度为3的单词,以'ing'结尾的单词,连续的 URL,URL 参数名和值,动词(以 -ed 或 -ing 结尾的单词)
时间: 2024-09-26 08:07:58 浏览: 33
Java正则表达式提取字符的方法实例
提取多种内容使用正则表达式可能会变得复杂,因为需要处理不同类型的内容,并且有些规则可能需要额外的解析步骤。下面分别给出一些基本的正则表达式例子:
1. **电子邮件**:
可以使用类似之前提供的邮箱提取模式。
2. **长度为3的单词 (三字母单词)**:
```regex
\b[a-zA-Z]{3}\b
```
3. **以'ing'结尾的单词**:
```regex
\b\w+ing\b
```
4. **连续的 URL (假设仅包含http/https开头)**:
```regex
(https?://[^\s]+)
```
注意这可能不会捕获URL参数和查询字符串,需要进一步解析才能获取这些信息。
5. **URL 参数名和值**:
需要使用HTML或URI解析库,因为直接的正则表达式难以准确识别。例如,使用Python的urllib.parse库:
```python
import urllib.parse
urls_with_params = urllib.parse.urlsplit(text)
params = urls_with_params.query
parsed_params = urllib.parse.parse_qs(params)
```
6. **动词 (以 -ed 或 -ing 结尾的单词)**:
```regex
\b(\w+[-ed]|[-ing]\w+)\b
```
对于上述每个点,实际应用中可能需要调整并结合使用,也可能需要配合其他语言特性如Python的`re.finditer()`以逐行分析并解析出更复杂的信息。由于涉及到更高级的解析,这里提供的只是基础的正则匹配部分。
阅读全文