HTML内容解析



我有两个代码来获得模板内没有字符第一个是

string html = this.GetHTMLContent(url);
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);
StringBuilder sb = new StringBuilder();
foreach (HtmlTextNode node in doc.DocumentNode.SelectNodes("//text()"))
{
    sb.AppendLine(node.InnerText);
}
string final = sb.ToString();
int lenght = final.Length; 

第二个是

var length = doc.DocumentNode.SelectNodes("//text()")
                .Where(x => x.NodeType == HtmlNodeType.Text)
                .Select(x => x.InnerText.Length)
                .Sum();

当我运行这两个代码返回我不同的结果。

最后我发现了问题所在。问题是在循环中我使用了appendLine()方法而不是append()方法。所以每次循环都附加新行。让一些空格也被识别为字符

相关内容

  • 没有找到相关文章

最新更新