问一个正则表达式的写法 vbs

Go_Rush 2006-04-10 06:17:08
我抓了几个网页,想用程序提取中间特定的一段html文字。如下


<html>
....
....
<div class="up1">
<div class="thetitle">
......
这部分是我要的内容,很长,中间还有几个table
<table .......><tr><td>....</td></tr></table......
<div id=...></div>
</div>

<span class="theend">
.....
....
</body>
</html>




我要提取的是class="thetitle",和class="theend" 中间的所有内容。


这个正则表达怎么写呢. 最好用 vbs 写
...全文
159 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
chouchy 2006-04-10
  • 打赏
  • 举报
回复
试试:
dim reg
set reg=New RegExp("<(.*) class=\'(thetitle|theend)\'>(.*)<\/\1>","ig")
meizz 2006-04-10
  • 打赏
  • 举报
回复
这个问题用正则解决起来会比较麻烦,我还是建议楼主你用DOM模型去取这个数据,比如把这段HTML插到页面里的一个iframe里去,然后通过 frames["iframe"].document.getElementsByTagName("DIV"); 然后 for 循环取到这个DIV
jspadmin 2006-04-10
  • 打赏
  • 举报
回复
如果不对的话,再调整下字符串字节数
jspadmin 2006-04-10
  • 打赏
  • 举报
回复
mid(str,instr(str,"thetitle")-12,instr(str,"theend")+2-instr(str,"thetitle")+12))
Go_Rush 2006-04-10
  • 打赏
  • 举报
回复
怎么把 在 class="thetitle", 之前
在 class="theend" 之后
的内容去掉。只留下他们中间的内容
Go_Rush 2006-04-10
  • 打赏
  • 举报
回复
meizz(梅花雪) 的方法是最简单的,我之前尝试过这样做,是可以取道。

但是如果通过 dom 去做的话,要等浏览器下载解析完脚本后才能操作,速度上就有点慢了。

通过字符串的方法可能有点笨,但是速度还是很快的,因为只要拿到文本就可以力马处理出来

jspadmin的方法应该可行,搞好了再来回贴

28,390

社区成员

发帖
与我相关
我的任务
社区描述
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
社区管理员
  • ASP
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧