HtmlAgilityPack 中文乱码
时间: 2023-02-11 18:31:06 浏览: 340
HtmlAgilityPack 是一个用于处理 HTML 的 .NET 库,它可以解析 HTML 文档,并在内存中修改它们。如果出现中文乱码问题,可能是因为编码问题导致的。可以尝试在读取 HTML 文档之前指定编码,例如:
```
string html = File.ReadAllText("file.html", Encoding.UTF8);
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);
```
也可以试着使用 WebClient 下载html,使用Encoding.GetEncoding("gb2312") 解码,具体如下
```
WebClient client = new WebClient();
client.Encoding = Encoding.GetEncoding("gb2312");
string html = client.DownloadString("http://example.com");
```
这样就可以避免中文乱码了。
阅读全文