正则去掉html 收尾空白
时间: 2023-10-14 18:21:23 浏览: 35
可以使用以下正则表达式来去掉HTML标签和收尾空白:
```python
import re
html = "<p>这是一段 <b>HTML</b> 文本。</p> "
cleaned = re.sub(r'<[^>]*>', '', html).strip()
print(cleaned)
```
输出:
```
这是一段 HTML 文本。
```
解释:
- `<[^>]*>`:匹配任何以 `<` 开始、以 `>` 结束的字符序列,这里表示匹配所有HTML标签。
- `re.sub()` 函数用来替换匹配的文本,第一个参数是正则表达式,第二个参数是替换的文本(这里是空字符串)。
- `strip()` 函数用来去掉字符串两端的空白。
相关问题
正则 去掉html 的 空白
可以使用以下正则表达式:
```html
/>(\s+)</g
```
其中,`>`和`<`表示html标签的开始和结束,`\s+`表示一个或多个空白字符,`()`表示捕获组,`/g`表示全局匹配。
使用JavaScript代码示例:
```javascript
const html = `
<div>
<p> hello world </p>
</div>
`;
const regex = />(\s+)</g;
const result = html.replace(regex, '><');
console.log(result);
// 输出:<div><p>hello world</p></div>
```
上述代码中,首先定义了一个包含空白字符的html字符串。然后使用正则表达式匹配空白字符,并将其替换为一个空字符串。最后输出结果,可以看到所有空白字符都被成功去除。
正则去掉所有换行 空白
我可以帮您实现正则去掉所有换行和空白的操作,以下是示例代码:
```python
import re
text = "This is a \n test string with \n multiple spaces and newlines."
# 去掉所有换行和空白
text = re.sub(r'\s+', '', text)
print(text) # Thisisateststringwithmultiplespacesandnewlines.
```
请注意,以上代码仅供参考,具体实现方式可能因编程语言和需求而异。