js去除字符串中的标签和样式,只保留中文和英文字符和标点符号
时间: 2024-04-01 17:38:28 浏览: 82
palindrome_js
你可以使用正则表达式来去除字符串中的标签和样式,只保留中文和英文字符和标点符号,示例代码如下:
```javascript
function removeTagsAndStyles(str) {
// 去除标签和样式
str = str.replace(/<[^>]+>|<\/[^>]+>|style="[^"]+"/gi, '');
// 只保留中文、英文字符和标点符号
str = str.replace(/[^\u4e00-\u9fa5a-zA-Z,.\s]/g, '');
return str;
}
// 示例用法
const htmlStr = '<div style="color:red">这是一段带有标签和样式的HTML字符串</div>';
const pureStr = removeTagsAndStyles(htmlStr);
console.log(pureStr); // 输出:这是一段带有标签和样式的HTML字符串
```
这段代码中,`removeTagsAndStyles` 函数接收一个 HTML 字符串作为参数,首先使用正则表达式去除所有的标签和样式,然后再使用另一个正则表达式保留中文、英文字符和标点符号,最后返回处理后的纯文本字符串。
阅读全文