现在我想用JavaScript做一个简单的功能,就是自动抓取一个页面中的特定内容

wydhao123 2010-05-20 11:12:21
现在我想用JavaScript做一个简单的功能,就是自动抓取一个页面中的特定内容
比如说http://www.baidu.com这个页面,我现在要抓取“把百度设为首页”这几个字,我的代码该怎么写啊?
哪位高手帮帮忙啊?
...全文
140 12 打赏 收藏 转发到动态 举报
写回复
用AI写文章
12 条回复
切换为时间正序
请发表友善的回复…
发表回复
eduyu 2010-05-21
  • 打赏
  • 举报
回复
关键是抓的内容是基于什么规则,我曾经做了一个软件,用户选择网页某区域,程序自动计算出该区域的xpath,并抓取。
wydhao123 2010-05-21
  • 打赏
  • 举报
回复
哪Ajax有没有解决方法勒 有也可以的
tntooo 2010-05-21
  • 打赏
  • 举报
回复
是的~ 楼上正解!
楼主直接放弃吧,javascript不可能搞定的!
这就是所谓的跨域问题,
你写代码的网页,和想抓取甚至想操作的网页,这两个!只要是主域名不一样!就甭想,
当然对你来说自己网页抓自己的网页到是可以,但也没什么意义了~
如果你真的做到了跨域,这就是漏洞!很快就出补丁给你补了!
wydhao123 2010-05-21
  • 打赏
  • 举报
回复
[Quote=引用 6 楼 sohighthesky 的回复:]

SQL code
js can not cross domain.
,try give up.
use any other server language instead
[/Quote]


有具体一点的代码吗 谢谢兄弟姐妹们
wydhao123 2010-05-21
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 myhope88 的回复:]

3楼的就可行了嘛
[/Quote]

能具体点吗 不是太明白
sohighthesky 2010-05-21
  • 打赏
  • 举报
回复
js can not cross domain.
,try give up.
use any other server language instead
myhope88 2010-05-21
  • 打赏
  • 举报
回复
3楼的就可行了嘛
wydhao123 2010-05-21
  • 打赏
  • 举报
回复
就是3楼的意思 哪位大哥有代码或者什么方法的 告诉下 不胜感激
meible2007 2010-05-21
  • 打赏
  • 举报
回复
应该是获取源文件,然后用正则表达式去匹配 标签间的内容
leemiki 2010-05-21
  • 打赏
  • 举报
回复
飘过!学习学习
meible2007 2010-05-21
  • 打赏
  • 举报
回复
下面的代码希望对你有用

string url = "http://www.baidu.com";

WebRequest request = WebRequest.Create(url);
WebResponse response = request.GetResponse();
Stream resStream = response.GetResponseStream();
//百度搜索用的是GB2312编码,所以利用HttpUtility.UrlEncode要做一个简单转换
StreamReader sr = new StreamReader(resStream, System.Text.Encoding.GetEncoding("GB2312"));

string html = sr.ReadToEnd();

resStream.Close();
sr.Close();



其中html 就是获取的源代码。得到之后匹配正则表达式吧
hibin101 2010-05-20
  • 打赏
  • 举报
回复
不会,先顶一下,等高手解决

87,910

社区成员

发帖
与我相关
我的任务
社区描述
Web 开发 JavaScript
社区管理员
  • JavaScript
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧