社区
非技术区
帖子详情
如何实现获取一个网站中所有的链接地址(a标签的href属性)
qq_25084099
2016-12-03 03:07:46
就是一个web网站中所有页面的url地址都要获取到。
比如说给定一所学校的主页,通过主页获取这个学校所有网页的url?注意不是一个网页。
主要用什么方法?今天用java写的(用的是递归)频频报错/
...全文
817
1
打赏
收藏
如何实现获取一个网站中所有的链接地址(a标签的href属性)
就是一个web网站中所有页面的url地址都要获取到。 比如说给定一所学校的主页,通过主页获取这个学校所有网页的url?注意不是一个网页。 主要用什么方法?今天用java写的(用的是递归)频频报错/
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Inhibitory
2016-12-03
打赏
举报
回复
jsoup 解析 hmtl
HTML
中
a
标签
href
属性
a
标签
主要用来做
链接
的跳转,注意herf
中
属性
值的灵活变化,主要搞清几个不跳转的值的区别。
获取
a
标签
中
的
href
属性
的值及修改
href
的
属性
值
//
获取
a
标签
中
href
的
属性
值 var
href
=$("a").attr("
href
"); //修改a
标签
中
href
的
属性
值 $("a").attr("
href
","www.baidu.com");
python正则表达式之
获取
a
标签
href
属性
url = re.compile(r'<h2.*?><a\b[^>]+\b
href
=\\"([^"]*)"[^>]*>.+?</a></h2>').findall(li) <h2.?> #表示在h2
标签
内 <a\b #匹配a
标签
的开始 [^>]+ #匹配a
标签
中
href
之前的内容 \b
href
="([^"])" ...
请用 python+selenium 爬取 XXX
网站
上的所有a
链接
的
href
属性
并访问,输出访问
地址
和状态码
请用 python+selenium 爬取 XXX
网站
上的所有a
链接
的
href
属性
并访问,输出访问
地址
和状态码
获取
页面所有a
标签
href
for(i=0;i<=document.getElementsByTagName("a").length;i++){ console.log(document.getElementsByTagName("a")[i].
href
); //输出该页面的所有
链接
。 }
获取
文本内容 var text = $('.content').text();consol...
非技术区
23,404
社区成员
70,593
社区内容
发帖
与我相关
我的任务
非技术区
Java 非技术区
复制链接
扫一扫
分享
社区描述
Java 非技术区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章