c# 正则表达式 html标签,C#使用正则表达式过滤html标签
时间: 2023-07-24 07:13:14 浏览: 277
你可以使用以下正则表达式来过滤 HTML 标签:
```csharp
string htmlString = "<p>This is a <b>sample</b> HTML string.</p>";
string noHtmlString = Regex.Replace(htmlString, @"<[^>]+>| ", "").Trim();
```
上述代码将会去掉 `htmlString` 中的所有 HTML 标签,返回一个纯文本字符串。正则表达式 `@"<[^>]+>| "` 中的 `[^>]+` 匹配所有不含 `>` 的字符,加上 `| ` 后可以过滤掉不需要的空格。
注意,这种方法并不是完全可靠的,因为有一些特殊情况可能会导致正则表达式匹配失败。如果需要更加严谨的 HTML 标签过滤,建议使用专门的 HTML 解析器。
相关问题
C#正则表达式匹配html标签
你可以使用以下的C#代码来匹配HTML标签:
```csharp
using System;
using System.Text.RegularExpressions;
class Program
{
static void Main()
{
string html = "<div><p>Hello, World!</p></div>";
// 正则表达式匹配HTML标签
string pattern = @"<[^>]+>";
MatchCollection matches = Regex.Matches(html, pattern);
foreach (Match match in matches)
{
Console.WriteLine(match.Value);
}
}
}
```
这段代码中,我们使用了 `<[^>]+>` 的正则表达式模式来匹配HTML标签。`<` 和 `>` 表示标签的开始和结束,`[^>]+` 表示匹配除了 `>` 之外的任意字符,`+` 表示匹配一个或多个前面的模式。
运行这段代码,它将输出匹配到的HTML标签:
```
<div>
<p>
</p>
</div>
```
希望能帮到你!如果还有其他问题,请随时提问。
阅读全文