抓包怎样只获取网页的真正解析的url

bluecodezlx 2011-06-24 09:15:31
题:
在 PC 的浏览器输入一个URL地址,然后获取网页。在这个过程中,网页会自动发出其他的获.取页面元素的连接,这些连接也都是URL,且其服.务器地址.一般也不一样。
请问我该怎样只获取用户真正访问的URL地址, 而过滤掉后续的url连接,比如一些网页内部的URL?
(注:我是在linux上编程)

...全文
767 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
nightkids_008 2011-07-11
  • 打赏
  • 举报
回复
比对下 几个URL之间的区别 找特征吧
bluecodezlx 2011-07-11
  • 打赏
  • 举报
回复
[Quote=引用 4 楼 ganzhezeng2 的回复:]

比如访问sina新闻的一个地址 /xxxx/xxxx.html
发包就是 get /xxxx/xxxx.html
/xxxx/xxxx.html 这个就是你想获得的吗?
截取以html的结尾
[/Quote]
恩,我需要的差不多就是用户真正访问过的URL,剔除一些不需要的信息!
solohac 2011-06-27
  • 打赏
  • 举报
回复
比如访问sina新闻的一个地址 /xxxx/xxxx.html
发包就是 get /xxxx/xxxx.html
/xxxx/xxxx.html 这个就是你想获得的吗?
截取以html的结尾
bluecodezlx 2011-06-27
  • 打赏
  • 举报
回复
怎么没人关注,自己顶起!!
bluecodezlx 2011-06-24
  • 打赏
  • 举报
回复
不一定是第一条URL,通过用HttpAnalyzer抓包得到的数据显示:
假如我测试访问:http://www.sina.com.cn/
抓包得到的get包 至少有70以上,其中就包括许多图片动画脚本的URL[这一部分可以去除],但一些浮动窗口url,友情链接等没有找到明显的特征!
ForestDB 2011-06-24
  • 打赏
  • 举报
回复
第一个请求?

69,381

社区成员

发帖
与我相关
我的任务
社区描述
C语言相关问题讨论
社区管理员
  • C语言
  • 花神庙码农
  • 架构师李肯
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧