使用Jsoup:
final String html = "<p> <span> foo </span> <em> bar <a> foobar </a> baz </em> </p>";document doc = Jsoup.parse(html);System.out.println(doc.text());
输出:
foo bar foobar baz
如果只需要p-tag的文本,请使用它代替
doc.text():
doc.select("p").text();…或仅身体:
doc.body().text();
越线:
final String html = "<p><strong>Tarthatatlan biztonsági viszonyok</strong></p>" + "<p><strong>Tarthatatlan biztonsági viszonyok</strong></p>";document doc = Jsoup.parse(html);for( Element element : doc.select("p") ){ System.out.println(element.text()); // eg. you can use a StringBuilder and append lines here ...}输出:
Tarthatatlan biztonsági viszonyok Tarthatatlan biztonsági viszonyok



