我是应届毕业生,大家帮帮我!
有家公司给我笔试的题目:
根据网址抓取数据(按email分三种情况,Email为最重要数据):
(1) 根据所给网站,抓取公司信息。 保存为 表 A
要求:必须字段包括:公司名称、email、联系人、公司地址、邮政编码、区号、电话、传真、行业、公司网址、抓取的网址
没有的字段信息为空。去除重复公司信息。
名称 网址 量 备注
万维商桥国际经贸 http://www.21trader.com/www_yufei/c_air.do?action=enterc_air 4w 点击进去可以查到mail。
我也尝试了一下,但是遇到一个困难就是如何用正则表达式来搜索URL:
Dim s As System.IO.Stream = wc.OpenRead("http://*.21trader.com"),这样好象不行啊,
还有就是读出来的string类型字符串如何装载到dataset中,谢谢!