如何获取在IE中打开的网页的XML代码(不使用WebRequest)



我正在尝试从已经在IE中打开的wabpage中获取XML文本。由于目标页面的安全性(带有证书等的冗长无聊的故事),不允许Web请求。我使用方法遍历所有打开的页面,如果我找到与页面 URI 匹配的页面,我需要获取它的 XML。前段时间我需要在正文标签之间获取一个 HTML 代码。我在IHTMLDocument2中使用了这样的方法:

private string GetSourceHTML()
{            
    Regex reg = new Regex(patternURL);
    Match match;
    string result;
    foreach (SHDocVw.InternetExplorer ie in shellWindows)
    { 
        match = reg.Match(ie.LocationURL.ToString());
        if (!string.IsNullOrEmpty(match.Value))
        {
            mshtml.IHTMLDocument2 doc = (mshtml.IHTMLDocument2)ie.Document;
            result = doc.body.innerHTML.ToString();
            return result;
        }                
    }
    result = string.Empty;
    return result;            
}

所以现在我需要获取目标页面的完整XML代码。我用谷歌搜索了很多,但没有找到任何有用的东西。有什么想法吗?谢谢。

你试过这个吗?它应该得到 HTML,希望你可以解析为 XML?

  • 检索 HTML 源代码

最新更新