怎样解析html标签呢?熟悉的朋友近来(急)
我现在想获取网页文件中的一个有用信息,例如:
<title>some title</title>
<h3>some text</h3>
网页文件中所有信息已经写入一个String中,我现在有什么比较好的办法获取到标签当中的文字信息呢
另外网页中可能有多个<h3></h3>标签,如何有效地把他们中的信息都取过来,我暂时只能想到
body.substring(body.substring("<h3>")+3,body.substring("</h3>")); 这样的笨方法,但是有一个问题就是如果存在多个<h3></h3>时可能有问题,你们有什么比较好的方法吗?java库中有没有现成的类可以利用吗?