正则提取连接地址的问题
用以下正则提取字符串中的url地址
$p = '#http.+?html#is';
preg_match_all($p, $cont, $match);
print_r( $match );
结果是正确返回了,可是其中出现了问题,以下是返回的部分结果:
[33] => http://test.domin.com/06/0429/08/2FS4GKTO00051CBQ.html
[34] => http://test.domin.com/06/0429/08/2FS4DUKE00051CBQ.html
[35] => http://test.domin.com/06/0429/05/2FRR92S700051CBQ.html
[36] => http://bbs.test.domin.com/board/rep.jsp?b=lottery&i=48979&p=0" target="_blank" class="f14">三个和尚挑水喝啊</a> <span class="time">(04-28 23:27)</span><br>
・<a href="http://test.domin.com/06/0428/22/2FR3MEJI00051CBQ.html
[37] => http://test.domin.com/06/0428/22/2FR3JVHK00051CBQ.html
[38] => http://test.domin.com/06/0428/22/2FR3AR2V00051CBQ.html
[39] => http://test.domin.com/06/0428/22/2FR368H800051CBQ.html
也就是说,下标[36]的部分,出现了异常情况,并不是我想要的结果
请教,如何修改正则,能把此类异常排除出去.也就是说,我只要完全匹配
以http:开头并且以.html结尾的连接地址