WebBrowser.Document 在从线程返回时为空，在新线程中不更新

public static User registerUser()
{
    Uri test = new Uri("https://www.example.com/signup");
    HtmlDocument testdoc = runBrowserThread(test);
    string tosend = "test";
    User user = new User();
    user.apikey = tosend;
    return user;
}
public static HtmlDocument runBrowserThread(Uri url)
{
    HtmlDocument value = null;
    var th = new Thread(() =>
    {
        var br = new WebBrowser();
        br.DocumentCompleted += browser_DocumentCompleted;
        br.Navigate(url);
        value = br.Document;
        Application.Run();
    });
    th.SetApartmentState(ApartmentState.STA);
    th.Start();
    th.Join(8000); 
    return value;
}
static void browser_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)
{
    var br = sender as WebBrowser;
    if (br.Url == e.Url)
    {
        Console.WriteLine("Natigated to {0}", e.Url);
        Console.WriteLine(br.Document.Body.InnerHtml);
        System.Console.ReadLine();
        Application.ExitThread();   // Stops the thread
    }
}

我正在尝试扫描此页面，虽然它确实获得了 HTML，但它不会将其传递回函数调用，而是发回 null（我认为这是后处理）。

我怎样才能使新线程传回其结果？

你的方法有几个问题。

你不是等到网页被导航，我的意思是直到Navigated事件。因此，在此之前，文档可能为空。
您将在 8 秒后退出，如果页面加载时间超过 8 秒，您将无法获得文档。
如果未正确加载文档，则会使线程保持活动状态。
我想WebBrowser控件将无法按预期工作，除非您将其添加到表单中并显示它（它需要在屏幕上可见）。

等。。

不要混淆事情。您的目标不能是使用 WebBrowser .如果只需要从网页下载字符串，请使用 HttpClient.GetStringAsync。

一旦你得到页面作为字符串格式，如果你想操作html，使用HtmlAgilityPack。

改用 WaitN 而不是默认浏览器模型。有点问题，但现在可以正常工作。

using (var browser = new FireFox("https://www.example.com/signup"))
        {
            browser.GoTo("https://example.com/signup");
            browser.WaitForComplete();

        }

相关内容

最新更新

热门标签：