求高手解决正则递归匹配的问题！

powerpolly 2008-05-23 09:53:59

$str = '
其他文本其他文本<div>仅单层</div></div>(注意：后面多一个</div>)
其他文本其他文本其他文本
<div>外层
<div>中层
<div>内层</div>
</div>
</div>
其他文本<font>外层<span>里层</span></font>其他文本其他文本……
';
$re = ???
preg_match_all($re,$str,$matches);
print_r($matches[0]);
希望结果是：
array(
0 => <div>仅单层</div>
1 => <div>外层
<div>中层
<div>内层</div>
</div>
</div>
2 => <font>外层<span>里层</span></font>
)

往往出来的第一个匹配是：<div>仅单层</div></div>，这不是想要的 <div>仅单层</div>

国内介绍正则递归的资料很少。希望高手顺便解释一下递归用法。

...全文

360 8 打赏收藏转发到动态举报

写回复

用AI写文章

8 条回复

切换为时间正序

请发表友善的回复…

发表回复

powerpolly 2008-05-26

打赏
举报

能否用来去掉UBB代码？

UBB代码经常可能有嵌套：



$str = '

[normal text here]加粗红色[color=#0000FF]蓝色红色[/color][/not match]

';

请问能否一次性去掉配对的UBB代码？



$re = ?

$result = preg_replace($re, $replace, $str);

print_r($result);



结果为：

[normal text here]加粗红色蓝色红色[/not match]

powerpolly 2008-05-26

打赏
举报

ice_berg16，能否详细说明递归的用法？

$re = "#<[a-z]([^ >]+)[^<>]*>([^<>]*|(?R))*</[^<>]+>#is";

([^<>]*|(?R))* 这里没看懂。

SysTem128 2008-05-25

打赏
举报



<?php

$str = '

其他文本其他文本 <div>仅单层 </div> </div>(注意：后面多一个 </div>)

其他文本其他文本其他文本

<div>外层

     <div>中层

         <div>内层 </div>

     </div>

</div>

# 这是另一种情况 

# start 闭合错误

<div>外层

     <div>中层

         <div>内层 </div>

     </div>

</font> 

# end 闭合错误

其他文本 <font>外层 <span>里层 </span> </font>其他文本其他文本……

'; 

$re = "/<([a-z]+)[^>]*>([^<>]|(?R))*<\/\\1>/is";

preg_match_all($re,$str,$matches);

print_r($matches[0]);

echo PHP_VERSION; // 5.2.5

?>

嘿嘿～被抢先了一步，整理一下～套点分～

fxs_2008 2008-05-25

打赏
举报

楼主查一下手册吧!Perl正则规范里有一段说明!仔细看一下!
ice_berg16很强大!

fxs_2008 2008-05-25

打赏
举报

ice_berg16 的很强大,收藏学习了!可以解决很多问题

查了一下,
$re = "`class[^{]+(\{([^{}]* ¦(?1))*\})`s";
也是ice_berg16 写的,

class[^{]+ 以class开始,后跟非{一个或多个

(\{([^{}]* ¦(?1))*\})分组
\{([^{}]* ¦(?1))*\} 匹配{}以内容
([^{}]* ¦(?1))* 中的内容,并递归,这具看不明白,不知为何要用(?1),这个指的递归哪个,第一个分组捕获?另外(?1)*后面有个*也不明白有什么用

手册上只有一小段英文介绍

ice_berg16 2008-05-24

打赏
举报

<?php

//*

$str = '

其他文本其他文本 <div>仅单层 </div> </div>(注意：后面多一个 </div>)

其他文本其他文本其他文本

<div>外层

     <div>中层

         <div>内层 </div>

     </div>

</div>

其他文本 <font>外层 <span>里层 </span> </font>其他文本其他文本……

'; 

$re = "#<[a-z]([^ >]+)[^<>]*>([^<>]*|(?R))*</[^<>]+>#is";

//*/



preg_match_all($re,$str,$matches);

print_r($matches[0]); 

?>