java获取网页超链接
<a href="http://weibo.com/" target="_blank" onclick="if(document.showLogin.username.value!=''&&document.showLogin.password.value!=''){LoginSelect('miniblog');return false;}"><img src="http://i0.sinaimg.cn/dy/deco/2011/0427/mblog_zs.jpg" width="82" height="21" alt="进入微博" /></a>
<a href="http://login.sina.com.cn/" target="_blank">会员中心</a>
<a href="http://tech.sina.com.cn/focus/sinahelp.shtml" target="_blank">客服帮助</a>
<a href="http://mail.sina.net/" target="_blank">企业邮箱</a>
<a href="http://news.sina.com.cn/437/2008/0701/14.html" target="_blank" id="sinaMobile">手机新浪网</a>
<a href="javascript:void(0);" id="setHomePage" onclick="SetHome(this)" style="behavior:url(#default#homepage);">设为主页</a>
<a href="http://news.sina.com.cn/guide/" target="_blank">新浪导航</a>
<a href="javascript:void(0);" id="L_freemail" onclick="LoginSelect('freemail')">免费邮箱</a>
<a href="javascript:void(0);" id="L_vipmail" onclick="LoginSelect('vipmail')">VIP邮箱</a>
<a href="javascript:void(0);" id="L_2008mail" onclick="LoginSelect('2008mail')">2008邮箱</a>
如上面的那样,我想提取出http://xxxxxx.yyy 和后面的文字。比如
<a href="http://mail.sina.net/" target="_blank">企业邮箱</a> 我想要得到http://mail.sina.net 和 企业邮箱