求正则表达式过滤页面标签

筱周 2011-05-25 03:19:21
<tr id="Excel"><td width='1%'></td><td width='98%'><table align=center cellspacing=0 cellpadding=3 class=table

width='100%'>
<tr bgcolor="#DEF0FE"><td class=td1 align='center'>序号</td><td class=td1 align='center'>许可证号<a

style='cursor:hand;' onclick="document.formx.orderBy.value='T001CERTIFICATE_NO asc'; document.formx.submit();"><font

color=#008000>∧</font></a><a style='cursor:hand;' onclick="document.formx.orderBy.value='T001CERTIFICATE_NO desc';

document.formx.submit();"><font color=#008000>∨</font></a></td><td class=td1 align='center'>名称<a

style='cursor:hand;' onclick="document.formx.orderBy.value='T001CORP_NAME asc'; document.formx.submit();"><font

color=#008000>∧</font></a><a style='cursor:hand;' onclick="document.formx.orderBy.value='T001CORP_NAME desc';

document.formx.submit();"><font color=#008000>∨</font></a></td><td class=td1 align='center'>负责人<a

style='cursor:hand;' onclick="document.formx.orderBy.value='T001OPER_MAN_NAME asc'; document.formx.submit();"><font

color=#008000>∧</font></a><a style='cursor:hand;' onclick="document.formx.orderBy.value='T001OPER_MAN_NAME desc';

document.formx.submit();"><font color=#008000>∨</font></a></td><td class=td1 align='center'>经营场所<a

style='cursor:hand;' onclick="document.formx.orderBy.value='T001FARE_PLACE asc'; document.formx.submit();"><font

color=#008000>∧</font></a><a style='cursor:hand;' onclick="document.formx.orderBy.value='T001FARE_PLACE desc';

document.formx.submit();"><font color=#008000>∨</font></a></td><td class=td3 align='center'>经济户口管理卡</td><tr

bgcolor='#FFFFFF'><td class="td1" align="middle">1</td><td align=center class=td1><font color=#FF0000><a

href='/XQuery/QueryShiPing/corp/detail/newest.jsp?

corpOrg=876&corpId=19443737&corpSeqId=3'>SP3200001110000034</a></font></td><td align=center class=td1><font

color=#0000FF><a href="javascript:winopenLink('/XQuery/QueryShiPing/corp/detail/newest1.jsp?

corpOrg=876&corpId=19443737&corpSeqId=3','700','500')">江苏食品流通许可证有限公司</a></font></td><td align=center

class=td1><font color=#0000FF><a href="javascript:winopenLink('/XQuery/QueryShiPing/corp/detail/owner.jsp?

corpOrg=876&corpId=19443737&corpSeqId=3','700','500')">姚清冰</a></font></td><td align=center class=td1>经营场所

</td><td class="td1" align="middle"><font color=#0000FF><a href="javascript:winopenLink

('/XQuery/QueryShiPing/pub/economycard.jsp?corpOrg=876&corpId=19443737&corpSeqId=3','700','500')">详情

</a></font></td></tr>
<tr bgcolor='#FFFFFF'><td class="td1" align="middle">2</td><td align=center class=td1><font color=#FF0000><a

href='/XQuery/QueryShiPing/corp/detail/newest.jsp?

corpOrg=876&corpId=19443793&corpSeqId=3'>SP3200001110000059</a></font></td><td align=center class=td1><font

color=#0000FF><a href="javascript:winopenLink('/XQuery/QueryShiPing/corp/detail/newest1.jsp?

corpOrg=876&corpId=19443793&corpSeqId=3','700','500')">江苏金鹰食品有限公司</a></font></td><td align=center

class=td1><font color=#0000FF><a href="javascript:winopenLink('/XQuery/QueryShiPing/corp/detail/owner.jsp?

corpOrg=876&corpId=19443793&corpSeqId=3','700','500')">朱卉明</a></font></td><td align=center class=td1>汉中路89号

</td><td class="td1" align="middle"><font color=#0000FF><a href="javascript:winopenLink

('/XQuery/QueryShiPing/pub/economycard.jsp?corpOrg=876&corpId=19443793&corpSeqId=3','700','500')">详情

</a></font></td></tr>
<tr bgcolor='#FFFFFF'><td class="td1" align="middle">3</td><td align=center class=td2><font color=#FF0000><a

href='/XQuery/QueryShiPing/corp/detail/newest.jsp?

corpOrg=876&corpId=19443752&corpSeqId=2'>SP3200001160000044</a></font></td><td align=center class=td2><font

color=#0000FF><a href="javascript:winopenLink('/XQuery/QueryShiPing/corp/detail/newest1.jsp?

corpOrg=876&corpId=19443752&corpSeqId=2','700','500')">江苏个体户食品有限公司</a></font></td><td align=center

class=td2><font color=#0000FF><a href="javascript:winopenLink('/XQuery/QueryShiPing/corp/detail/owner.jsp?

corpOrg=876&corpId=19443752&corpSeqId=2','700','500')">姚清冰</a></font></td><td align=center class=td2>经营场所

</td><td class="td1" align="middle"><font color=#0000FF><a href="javascript:winopenLink

('/XQuery/QueryShiPing/pub/economycard.jsp?corpOrg=876&corpId=19443752&corpSeqId=2','700','500')">详情

</a></font></td></tr>
</table>
</td><td width='1%'> </td></tr>


上面取到得字符串 求正则表达式 过滤<a><font>标签里面的内容 样式也不需要 class,align这些属性也不需要
截完的内容大致为
<tr id="Excel" >
<table>
<tr>
<td>内容1</td>
<td>内容2</td>
....
</tr>
<tr>
<td>内容1的值</td>
<td>内容2的值</td>
..
</tr>
</table>
</tr>
</tr>
...全文
186 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
菜继续 2011-05-27
  • 打赏
  • 举报
回复
求解~~~
筱周 2011-05-27
  • 打赏
  • 举报
回复
已解决,谢谢各位回复!
结贴!
HOME_ning 2011-05-27
  • 打赏
  • 举报
回复
天花乱坠,俺看不懂的路过瞻仰一番~
uastation 2011-05-27
  • 打赏
  • 举报
回复
用HTML解析工具用起来会好一点;
htmlparser.jar工具
-过客- 2011-05-26
  • 打赏
  • 举报
回复
try...

String str = ReadFile("g:/test.txt", "gb2312"); 
String result = str.replaceAll("</?(?:font|a)[^>]*>|(?<=<(?:table|tr|td))[^>]*?(?:(\\sid=\"[^\"]*\")|(?=>))[^>]*(?=>)", "$1");
System.out.println(result);
/*-----输出-----
<tr id="Excel"><td></td><td><table>
<tr><td>序号</td><td>许可证号∧∨</td><td>名称∧∨</td><td>负责人∧∨</td><td>经营场所∧∨</td><td>经济户口管理卡</td><tr><td>1</td><td>SP3200001110000034</td><td>江苏食品流通许可证有限公司</td><td>姚清冰</td><td>经营场所

</td><td>详情

</td></tr>
<tr><td>2</td><td>SP3200001110000059</td><td>江苏金鹰食品有限公司</td><td>朱卉明</td><td>汉中路89号

</td><td>详情

</td></tr>
<tr><td>3</td><td>SP3200001160000044</td><td>江苏个体户食品有限公司</td><td>姚清冰</td><td>经营场所

</td><td>详情

</td></tr>
</table>
</td><td> </td></tr>
*/

81,094

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧