我是应届毕业生,大家帮帮我!

yinuo8202 2005-04-08 04:50:12
有家公司给我笔试的题目:
根据网址抓取数据(按email分三种情况,Email为最重要数据):
(1) 根据所给网站,抓取公司信息。 保存为 表 A
要求:必须字段包括:公司名称、email、联系人、公司地址、邮政编码、区号、电话、传真、行业、公司网址、抓取的网址
没有的字段信息为空。去除重复公司信息。
名称 网址 量 备注
万维商桥国际经贸 http://www.21trader.com/www_yufei/c_air.do?action=enterc_air 4w 点击进去可以查到mail。


我也尝试了一下,但是遇到一个困难就是如何用正则表达式来搜索URL:
Dim s As System.IO.Stream = wc.OpenRead("http://*.21trader.com"),这样好象不行啊,

还有就是读出来的string类型字符串如何装载到dataset中,谢谢!
...全文
214 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
yinuo8202 2005-04-26
  • 打赏
  • 举报
回复
晕了,楼上的高手请问:
我在数据库里直接建表的,如果按你说的,通过代码建表,有什么其他的好处呢,除了上机课用ORACLE,在终端的时候我这样用过,其他的时候没这样用过,这样不是很麻烦吗?

我的题目就是阿里巴巴公司给的,已经实现了,也遇到了很多困难,到现在还是有些问题没有完全解决,
不过阿里巴巴公司要求太高了,没机会了,555,谢谢各位了!
Overriding 2005-04-21
  • 打赏
  • 举报
回复
读取网络流的类很多,socket,webclient,webrequest.webresponse.

主要是你要找到相关内容必须用正则表达式.

你的string的东西完全可以自己手动构建一个表.

Dim table As New DataTable("tablename")
Dim col As New DataColumn("email",GetType(string))
....
table.Columns.Add(col)
...
Dim row As DataRow=table.NewRow()
row("email")="ssss@sss.com"
table.Rows.Add(row)
rockplayer 2005-04-21
  • 打赏
  • 举报
回复
刚做了一个抓取ALIBABA的呵呵,不会用正则表达式.用截取字符串也大致做出来了,包括抓取分类啊,公司啊,公司相对应的产品啊,就是通过HTML找有特征的标签啊,这样好象比用正则表达式简单些./就是有很多特殊情况,比较麻烦
jeoge 2005-04-21
  • 打赏
  • 举报
回复
技术不行啊
不敢给你答案啊
记住到网上去找啊
yinuo8202 2005-04-21
  • 打赏
  • 举报
回复
怎么没人回啊

16,550

社区成员

发帖
与我相关
我的任务
社区描述
VB技术相关讨论,主要为经典vb,即VB6.0
社区管理员
  • VB.NET
  • 水哥阿乐
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧