我正在尝试用java实现一个web代理服务器,该服务器将在浏览器和web之间中继请求和响应。在当前设置中,我让浏览器将所有页面请求发送到指定端口上的localhost,并且我的代理正在该端口上侦听传入请求。
整个过程都是线程化的,这样就可以同时处理多个请求,下面是我的代码:
private void startProxy(int serverPort){
try {
// create a socket to listen on browser requests
ServerSocket servSocket = new ServerSocket(serverPort);
while(true) {
// create a thread for each connection
ProxyThread thread = new ProxyThread(servSocket.accept());
thread.start();
}
} catch (IOException e) {}
}
class ProxyThread extends Thread {
private Socket client;
private Socket server;
public ProxyThread(Socket client) {
this.client = client;
server = new Socket();
}
public void run() {
// passes on requests and responses here
}
我注意到,当我尝试加载一个包含20个不同的html/css/js请求的页面时,有时只创建18-19个线程,在这个过程中会丢失一些请求。对js资源或图像的请求通常会被丢弃,而且它们从来都不是浏览器发出的最后一个请求,所以这不是资源耗尽的问题。
使用wireshark,我能够确定丢失的请求确实会到达localhost,因此出于某种原因,ServerSocket.accept()实际上并不接受连接。为什么会发生这种情况,有什么特别的原因吗?或者我的代码在某种程度上是错误的?
编辑
这是run()的正文
try {
BufferedReader clientOut = new BufferedReader(
new InputStreamReader(client.getInputStream()));
OutputStream clientIn = client.getOutputStream();
// assign default port to 80
int port = 80;
String request = "";
// read in the first line of a HTTP request containing the url
String subRequest = clientOut.readLine();
String host = getHost(subRequest);
// read in the rest of the request
while(!subRequest.equals("")) {
request += subRequest + "rn";
subRequest = clientOut.readLine();
}
request += "rn";
try {
server.connect(new InetSocketAddress(host, port));
} catch (IOException e) {
String errMsg = "HTTP/1.0 500nContent Type: text/plainnn" +
"Error connecting to the server:n" + e + "n";
clientIn.write(errMsg.getBytes());
clientIn.flush();
}
PrintWriter serverOut = new PrintWriter(server.getOutputStream(), true);
serverOut.println(request);
serverOut.flush();
InputStream serverIn = server.getInputStream();
byte[] reply = new byte[4096];
int bytesRead;
while ((bytesRead = serverIn.read(reply)) != -1) {
clientIn.write(reply, 0, bytesRead);
clientIn.flush();
}
serverIn.close();
serverOut.close();
clientOut.close();
clientIn.close();
client.close();
server.close();
} catch(IOException e){
e.printStackTrace();
}
对于一个有10个请求的网页,我得到了10个HTTP get,6个SYN和SYN,ACK,其中7个请求成功通过代理,3个被卡住。
因此,您有6个独立的连接,但有10个请求,并且每个连接只处理一个请求。您忘记了实现HTTP保活。参见RFC 2616。每个连接可能会收到多个请求。每个请求需要读取与内容长度标头或块的总和定义的字节数完全相同的字节数,无论存在什么,如果有的话,然后您不需要关闭套接字,而是需要返回并尝试读取另一个请求。如果这样就结束了流,请关闭套接字。
或者将您的响应以HTTP1.0或Connection: close
标头的形式发送回客户端,这样它就不会试图将连接重新用于另一个请求。