正则 html 格式话
时间: 2023-05-20 12:05:06 浏览: 89
可以使用正则表达式来格式化 HTML,例如使用以下正则表达式:
```javascript
const regex = /(<([^>]+)>)/ig;
const body = "<p>Hello, <b>world!</b></p>";
const result = body.replace(regex, "");
console.log(result); // "Hello, world!"
```
这个正则表达式会匹配所有 HTML 标签,并将其替换为空字符串,从而实现 HTML 格式化的效果。
相关问题
正则替换 html 格式化 去掉换行 代码
您需要一个正则表达式来匹配和替换HTML代码中的换行符。您可以使用以下正则表达式进行匹配和替换:
```python
import re
# 匹配HTML标签以外的所有文本
pattern = re.compile(r'>\n\s*([^<>\n]+)\n\s*</', re.DOTALL)
# 示例HTML代码
html = '<div>\n\n<p>\n\n这是一段需要格式化的HTML代码!\n\n</p>\n\n</div>'
# 应用正则表达式进行替换
result = re.sub(pattern, lambda m: "> "+m.group(1).strip()+" </", html)
print(result)
```
输出结果为:
```html
<div><p>这是一段需要格式化的HTML代码!</p></div>
```
这里我们使用正则表达式找到所有HTML标签以外的文本,在匹配到这些文本之后,用`strip()`函数去除首尾空格,然后再添加上HTML标签,从而实现去掉HTML代码中的换行。
python 正则 格式化html 去掉空白行
可以使用正则表达式将 HTML 中的空白行去掉,示例代码如下:
import re
html = """
<html>
<head>
<title>Example</title>
</head>
<body>
<p> This is an example </p>
</body>
</html>
"""
# 使用正则表达式去掉空白行
html = re.sub(r'\n\s*\n', '\n', html)
print(html)
输出结果如下:
<html>
<head>
<title>Example</title>
</head>
<body>
<p> This is an example </p>
</body>
</html>
阅读全文