所以我一直在尝试使用c#WebClient
的东西。我设法用类似于下面的代码制作了一个工作程序(控制台应用程序(:
static void Search(string number)
{
using (var client = new WebClient())
{
for (int a = 0; a < globalvariable.lenght; a++)
{
string toWrite = "nothing";
for (int b = 0; a < globalvariable2.lenght; b++)
{
string result = client.DownloadString(urlString);
//do stuff with toWrite if page is not empty
//change toWrite and break the b loop
}
Console.WriteLine(toWrite);
}
}
}
它不是很快,所以我认为我可以通过使用多个线程来使其更快。 执行需要 2 分钟。
所以我试着让循环成为一个Parallel.For
循环。执行仍然需要 2 分钟。所以我在这里阅读了东西并编写了以下代码:
static async Task AWrite(string number, int a)
{
using (var client = new WebClient())
{
string toWrite = "nothing";
for(int b=0; a<globalvariable2.lenght; b++)
{
string result = await client.DownloadStringTaskAsync(uri);
//do stuff with toWrite if page is not empty
//change toWrite and break the b loop
}
Console.WriteLine(toWrite);
}
}
然后调用它的函数:
private static void ASearch(string number)
{
var tasks = new List<Task>();
for(int a=0; a<gobalvariable.Length; a++)
{
tasks.Add(AWrite(number, a));
}
Task.WaitAll(tasks.ToArray());
}
所以我认为多个WebClient
将同时下载字符串,显然这不会发生,因为这也需要两分钟才能执行。为什么?通过控制台中的写作,我知道它们没有按顺序执行,但仍然需要相同的时间。如何通过使用多个线程实际提高第一个函数的性能?
您可以更改 HTTP 连接限制:
System.Net.ServicePointManager.DefaultConnectionLimit = 5;
查看ServicePointManager.DefaultConnectionLimit以及有关ServicePoint类的文章。使用此属性,可以更改 HTTP 连接的默认连接限制。
最后,限制在于我正在下载的网站。它限制为每人 1 个 HTTP 连接。谢谢你的想法。