首先,回答您的问题:
连接重置是由服务器端的问题引起的。服务器很可能无法解析该请求或无法处理该请求,并因此在没有返回有效响应的情况下断开了连接。HttpClient生成的HTTP请求中可能导致服务器逻辑失败的原因可能是服务器错误。仅仅因为错误消息没有说“
by peer”,并不意味着连接重置发生在客户端。
几点评论:
(1)诸如bixo
http://openbixo.org/之类的几种流行的Web爬网程序使用HttpClient时没有出现重大问题,但是其中许多人不得不调整HttpClient的行为,以使其对常见的HTTP协议违规行为更加宽容。默认情况下,HttpClient在HTTP协议遵从性方面非常严格。
(2)为什么不向HttpClient项目报告NPE问题或您遇到的任何其他问题?



