如何使用asp的正则表达式达到获取网页上的数据的目的
我想要做的事情是这样的:
从网址 http://www.abc***.com/***.htm上提取一些我想要的数据并存放到我的数据库中。
现在我已经获取了该页面的一段我感兴趣的表格,问题是,我如何再从中获取我想要的信息呢?
比如说,在这段代码中,有黑体字“品名”,“价格”,“联系方式”,其后有与其相关具体信息,如 茶叶,200/斤,028-0000000
,等,但是有时候中间的某些信息缺失为空。
我想的方法是,我先找到一个<P class=Headline1>取其后的字符为变量名,再取其后出现的第一个</p>与直到下一个出现的<P
class=Headline1>之间的部分,去除html符号,作为变量值,循环直到代码结束.
这样的思路是不是复杂了点,不知大家有些什么意见,或者能否给段实现的代码给我参考一下.我对正则表达式也不太熟,不知道怎么写
.谢谢了!