我正在尝试从已经在IE中打开的wabpage中获取XML文本。由于目标页面的安全性(带有证书等的冗长无聊的故事),不允许Web请求。我使用方法遍历所有打开的页面,如果我找到与页面 URI 匹配的页面,我需要获取它的 XML。前段时间我需要在正文标签之间获取一个 HTML 代码。我在IHTMLDocument2中使用了这样的方法:
private string GetSourceHTML()
{
Regex reg = new Regex(patternURL);
Match match;
string result;
foreach (SHDocVw.InternetExplorer ie in shellWindows)
{
match = reg.Match(ie.LocationURL.ToString());
if (!string.IsNullOrEmpty(match.Value))
{
mshtml.IHTMLDocument2 doc = (mshtml.IHTMLDocument2)ie.Document;
result = doc.body.innerHTML.ToString();
return result;
}
}
result = string.Empty;
return result;
}
所以现在我需要获取目标页面的完整XML代码。我用谷歌搜索了很多,但没有找到任何有用的东西。有什么想法吗?谢谢。
你试过这个吗?它应该得到 HTML,希望你可以解析为 XML?
- 检索 HTML 源代码