我[正在]处理[HTTP]流量数据集,该数据集由完整的POST和GET请求组成
因此,您想解析包含多个HTTP请求的文件或列表。您要提取什么数据?无论如何,这里是一个Java HTTP解析类,它可以读取请求行中使用的方法,版本和URI,并将所有标头读取到哈希表中。
如果您想重新发明轮子,可以使用一个或自己写一个。看一下RFC,看看请求是什么样的,以便正确解析它:
Request = Request-Line ; Section 5.1 *(( general-header ; Section 4.5 | request-header ; Section 5.3 | entity-header ) CRLF) ; Section 7.1 CRLF [ message-body ] ; Section 4.3



