从javascript中获取带有渲染html的网页源代码



如果我使用这个

WebClient client = new WebClient();
String htmlCode = client.DownloadString("http://test.net");

我能够使用敏捷包扫描html并获得我需要的大多数标签,但它缺少javascript呈现的html。

我的问题是,如何使用c#获得最终呈现的页面源代码。运行javascript后,WebClient是否还有其他功能可以获得最终呈现的源代码?

HTML敏捷包本身不足以满足您的需求,您还需要一个javascript引擎。要做到这一点,您可能需要查看Geckofx之类的东西,它将允许您在应用程序中嵌入一个功能齐全的web浏览器,并允许您在页面呈现后以编程方式访问dom的内容。

http://code.google.com/p/geckofx/

您需要在应用程序中封装浏览器。

你很幸运!WebKit有一个.NET包装。http://webkitdotnet.sourceforge.net/

您可以使用System.Windows.Forms.中的WebBrowser类

using (WebBrowser wb = new WebBrowser()) 
{
    //Code here
}

https://msdn.microsoft.com/en-us/library/system.windows.forms.webbrowser(v=vs.110).aspx

最新更新