求助使用正则表达式提取网页中的文字

mam0094 2012-01-16 05:33:19
我现在要从网页的源码中提取出我需要的文字内容,但是对正则表达式不熟,所以请教高手帮我看看应该怎么弄,谢谢!

我需要的内容:
1、Dear My friends, 2011已经过去了,烦恼也统统过去了,寒冷也悄悄走了,疲惫也渐渐消失了,让我们梳理下心情,携着幸福,带上快乐一起狂奔,2012我们来了!
2、Hi ,辛苦一年不容易,大家都很努力,工作有了新成绩,欢喜我们都如意,11总结走过去,12重新再崛起,把激情留下,把斗志守住,把目标牢记,把奋斗拼起,愿你12再创辉煌,成就奇迹。

网页源码内容如下:
------------------------------------------------------------------
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE wml PUBLIC "-//WAPFORUM//DTD WML 1.1//EN" "http://www.wapforum.org/DTD/wml_1.1.xml">

<wml>

<head>
<meta forua="true" http-equiv="Cache-Control" content="no-cache" />
<meta forua="true" http-equiv="Cache-Control" content="max-age=0" />
<meta forua="true" http-equiv="Cache-Control" content="must-revalidate" />
</head>

<card id="start" title="消息盒子">
<p>

会话2|<a href="/im/box/unDealSystemList.action">待处理</a>|<a href="/im/box/notNeedDealSystemList.action">通知</a>


<br/>========<br/>
<img alt="." src="/im/images/userstatus/closed.gif"/><a href="/im/chat/toinputMsg.action?touserid=901049322&box=true&t=65221772848667869">民</a>:Dear My friends, 2011已经过去了,烦恼也统统过去了,寒冷也悄悄走了,疲惫也渐渐消失了,让我们梳理下心情,携着幸福,带上快乐一起狂奔,2012我们来了!(使用电脑登录飞信,更多功能更精彩) 09:12<br/>

<anchor>回复<go method="post" href="/im/chat/toinputMsg.action"><postfield name="touserid" value="901049322"/><postfield name="backUrl" value="alllist"/></go></anchor>|<anchor>对话<go method="post" href="/im/chat/toinputMsg.action"><postfield name="touserid" value="901049322"/></go></anchor>|<anchor>转发<go method="post" href="/im/sayHello/sayHelloChooseFriendsByAll.action"><postfield name="type" value="all"/><postfield name="selectType" value="all"/><postfield name="fromSelect" value="fromSelectAll"/><postfield name="sayHelloText" value="Dear My friends, 2011已经过去了,烦恼也统统过去了,寒冷也悄悄走了,疲惫也渐渐消失了,让我们梳理下心情,携着幸福,带上快乐一起狂奔,2012我们来了!
(使用电脑登录飞信,更多功能更精彩)"/></go></anchor>|<anchor>删除<go method="post" href="/im/box/deleteMessages.action"><postfield name="fromIdUser" value="901049322"/></go></anchor><br/>--------<br/>
<img alt="." src="/im/images/userstatus/VIPsms.gif"/><a href="/im/chat/toinputMsg.action?touserid=421794820&box=true&t=65221772848816869">英</a>:Hi ,辛苦一年不容易,大家都很努力,工作有了新成绩,欢喜我们都如意,11总结走过去,12重新再崛起,把激情留下,把斗志守住,把目标牢记,把奋斗拼起,愿你12再创辉煌,成就奇迹。(使用电脑登录飞信,更多功能更精彩) 09:13<br/>

<anchor>回复<go method="post" href="/im/chat/toinputMsg.action"><postfield name="touserid" value="421794820"/><postfield name="backUrl" value="alllist"/></go></anchor>|<anchor>对话<go method="post" href="/im/chat/toinputMsg.action"><postfield name="touserid" value="421794820"/></go></anchor>|<anchor>转发<go method="post" href="/im/sayHello/sayHelloChooseFriendsByAll.action"><postfield name="type" value="all"/><postfield name="selectType" value="all"/><postfield name="fromSelect" value="fromSelectAll"/><postfield name="sayHelloText" value="Hi ,辛苦一年不容易,大家都很努力,工作有了新成绩,欢喜我们都如意,11总结走过去,12重新再崛起,把激情留下,把斗志守住,把目标牢记,把奋斗拼起,愿你12再创辉煌,成就奇迹。
(使用电脑登录飞信,更多功能更精彩)"/></go></anchor>|<anchor>删除<go method="post" href="/im/box/deleteMessages.action"><postfield name="fromIdUser" value="421794820"/></go></anchor><br/>--------<br/>

<br />
(共1页)<br/>


【<a href="http://f.10086.cn/info/c/?rid=2-608">飞信都在看</a>】<a href="http://f.10086.cn/info/c/?rid=2-16">滚动</a>|<a href="http://f.10086.cn/f/foinid">排行</a><br/><a href="http://f.10086.cn/info/c/?rid=1-211034">女子患上怪病负心男友离开</a><br/><a href="http://f.10086.cn/info/c/?rid=1-211030">神秘!2012玛雅末日预言真相</a><br/><a href="http://f.10086.cn/info/c/?rid=1-211036">救助站助流浪17年女子回家</a><br/>[<a href="http://f.10086.cn/f/liaotian">聊天广场</a>]<a href="http://f.10086.cn/im/talk/indexs.action?name=%E5%A6%82%E4%BD%95%E7%9C%8B%E5%A5%B3%E7%94%9F%E5%8C%96%E5%A6%86">如何看化妆美女</a><br/><a href="http://f.10086.cn/im/talk/indexs.action?name=%E4%BD%A0%E5%AE%B6%E8%B0%81%E4%B8%BB%E5%8E%A8">你家谁主厨</a>|<a href="http://f.10086.cn/im/talk/indexs.action?name=%E6%80%8E%E4%B9%88%E7%9C%8B%E5%88%86%E6%89%8B%E4%B9%8B%E5%90%8E%E7%9A%84%E5%A4%8D%E5%90%88">咋看分手后复合</a><br/><img src="http://f.10086.cn/images/news/upload/news/119/2610_141.GIF" alt="fetion"/><a href="http://f.10086.cn/f/ma">2012年祝福好友温情更深</a><br/><a href="http://f.10086.cn/info/c/?nid=589">[短信]小寒节气!温暖传给TA</a><br/>

<a href="/im/index/index.action?type=rec&t=65221772850382869">最近联系人</a>|<a href="/im/user/insertfriend1.action?t=65221772850399869">添加好友</a><br/>
<a href="/im/index/index.action?t=65221772850404869">返回WAP飞信</a>
<br/>

<br/>

<a href="http://f.10086.cn/space/myspace/layout.action">空间</a>-<a href="http://f.10086.cn/jy/home/index.action">家园</a>-<a href="/im/index/index.action?t=65221772852337869">WAP飞信</a><br/>
<a href="http://f.10086.cn/index.jsp">手机飞信网</a>-<a href="http://f.10086.cn/info/c/?nid=29">导航</a>-<a href="http://f.10086.cn/portal/cscenter.action?do=layout">客服</a>
<br/>

[01月16日 09:15]

</p>
</card>
</wml>
-------------------------------------------------------------------
...全文
142 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
mam0094 2012-01-17
  • 打赏
  • 举报
回复
假如我现在只提取第一个内容,完整的代码应该是怎样的?我对正则表达式真的不懂,只是现在急需这个功能,马上学也学不会,所以请好心人帮帮我吧。
mam0094 2012-01-16
  • 打赏
  • 举报
回复
能不能给个完整的提取代码?
  • 打赏
  • 举报
回复
做这样的就是要找出共同点
这2个内容的共同点就是</a>:开始,以(结束

那么正则可以写成
"/\<\/a\>\:(.*?)\(/"

28,390

社区成员

发帖
与我相关
我的任务
社区描述
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
社区管理员
  • ASP
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧