社区
网络通信/分布式开发
帖子详情
关于提取网页的链接问题请教
delphi168
2006-06-22 05:00:58
我想实现从一个网页中获取该网页的所有链接,尝试过用webbrowser,只能获取<a href="">之类的链接,但是对于javascripts写的链接就无能为力?请问有没有高手曾经做过同类的控件、函数,请指教。
...全文
260
6
打赏
收藏
关于提取网页的链接问题请教
我想实现从一个网页中获取该网页的所有链接,尝试过用webbrowser,只能获取之类的链接,但是对于javascripts写的链接就无能为力?请问有没有高手曾经做过同类的控件、函数,请指教。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
jamosnet
2006-07-27
打赏
举报
回复
这个问题没有ttk想的简单,对于他的爬虫我表示怀疑
javascript的连接我是这么理解的,连接是js生成的,例如
for( i=0,j=0;i<10;i++,j++ )
{
src = "../link"+i+".cgi?" + j
document.write( "<a href="+src+">link</a>" )
}
连接是算出来的,不能简单匹配字符串
我有个不聪明的办法,用webbrowser载入页面,然后获取其中的所有连接
tttk
2006-06-23
打赏
举报
回复
我写的只是个大概,根据实际情况会有所变化。我不太明白你说的javascript里面的链接是什么意思?
我以前做过一个新闻爬虫软件,专门分析网页中的各种链接,没有什么问题。
飞天揽月
2006-06-23
打赏
举报
回复
不能
delphi168
2006-06-23
打赏
举报
回复
谢谢tttk(网络芝麻) 指教,如何使用规则表达式?是不是要用控件?
但我看这两个表达式,估计也不能从javascript中抽取链接。
tttk
2006-06-22
打赏
举报
回复
所有的锚链接:(?i)href=['|"]?([^ >]+)['|"]?)[^>]+
所有的src链接 (?i)src=['|"]?([^ >]+)['|"]?)[^>]+
tttk
2006-06-22
打赏
举报
回复
建议用规则表达式来解决
asp.net知识库
帮助解决
网页
和JS文件中的中文编码
问题
的小工具 慎用const关键字 装箱,拆箱以及反射 动态调用对象的属性和方法——性能和灵活性兼备的方法 消除由try/catch语句带来的warning 微软的应试题完整版(附答案) 一个...
请教
!我要做个
网页
,不知如何连接数据库?
做了个爬虫爬了点数据,然后现在想搞个数据展示,准备做个
网页
,将我数据库中的url
提取
出来做成资源下载超
链接
,然后想搞个索引,搜索可以实现相关内容的超
链接
呈现,我该怎么做!!! 你需要页面访问后台CRUD 有...
第二章:视觉特征
提取
本章介绍计算机视觉中视觉特征
提取
的知识。
使用MFC开发
网页
提取
程序的经验总结
最近开发了一个在
网页
内
提取
页面信息并发往后台进行处理的数据库,在开发的过程中遇到了一些
问题
,获得了一些经验,在此先感谢下CSDN上的大神的无私分享。 在项目之初,想在一个程序的基础上修改,由于原来的代码...
Linux 抓取
网页
实例(shell+awk)
Linux 抓取
网页
实例(shell+awk)
网络通信/分布式开发
1,593
社区成员
32,964
社区内容
发帖
与我相关
我的任务
网络通信/分布式开发
Delphi 网络通信/分布式开发
复制链接
扫一扫
分享
社区描述
Delphi 网络通信/分布式开发
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章