如何使用asp的正则表达式达到获取网页上的数据的目的

hotmail3 2008-01-04 12:31:54
我想要做的事情是这样的:
从网址 http://www.abc***.com/***.htm上提取一些我想要的数据并存放到我的数据库中。
现在我已经获取了该页面的一段我感兴趣的表格,问题是,我如何再从中获取我想要的信息呢?
比如说,在这段代码中,有黑体字“品名”,“价格”,“联系方式”,其后有与其相关具体信息,如 茶叶,200/斤,028-0000000

,等,但是有时候中间的某些信息缺失为空。
我想的方法是,我先找到一个<P class=Headline1>取其后的字符为变量名,再取其后出现的第一个</p>与直到下一个出现的<P

class=Headline1>之间的部分,去除html符号,作为变量值,循环直到代码结束.
这样的思路是不是复杂了点,不知大家有些什么意见,或者能否给段实现的代码给我参考一下.我对正则表达式也不太熟,不知道怎么写

.谢谢了!
...全文
87 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
dsjian 2008-01-05
  • 打赏
  • 举报
回复
顶一下!
jeffery188604253 2008-01-05
  • 打赏
  • 举报
回复
下载火车头这个软件。。。很有用的,
什么都不能 2008-01-05
  • 打赏
  • 举报
回复
function getParamValue(param)
dim ptn:ptn=param&"^<*?"
dim reg
set reg=new RegExp
reg.global=true
reg.ignoreCase=true
set matches=reg.execute(ptn)
getParamValue=matches(0)
end function

location=getParamValue("Location")
price=getParamvalue("Price")
...
试一下
hotmail3 2008-01-04
  • 打赏
  • 举报
回复
自己顶
hotmail3 2008-01-04
  • 打赏
  • 举报
回复
<TABLE width=420 border=0 cellPadding=0 cellSpacing=0>
<TBODY>
<TR>
<TD width=210 height=24>
<P class=Headline1>Location : </P></TD>
</TR>
<TR>
<TD vAlign=top>
<TABLE cellSpacing=0 cellPadding=0 width=210 border=0>
<TBODY>
<TR>
<TD height=5></TD></TR>
<TR>
<TD height=24>
<P class=Headline1>Price : </P></TD></TR>
<TR>
<TD height=18>
<P class=normal>200/斤</P></TD></TR>
<TR>
<TD height=5></TD></TR>
<TR>
<TD height=24>
<P class=Headline1>name : </P></TD></TR>
<TR>
<TD vAlign=bottom height=12>
<P class=small>tea</P></TD></TR>
<TR>
<TD vAlign=top height=18>
<P class=normal> </P></TD></TR>
<TR>
<TD></TD></TR></TBODY></TABLE></TD>
</TR></TBODY></TABLE>
表格就是这样的,location 的值为空,price为 200/斤,name为tea,我就是想把该信息作为一条记录插入到我的数据库里。谢谢
Atai-Lu 2008-01-04
  • 打赏
  • 举报
回复
呃,把你抓取到的,想要筛选的html代码贴出来,不要忘了说出你想要的效果...

28,391

社区成员

发帖
与我相关
我的任务
社区描述
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
社区管理员
  • ASP
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧