Python 爬虫 正则路径文件

James-CDD 2014-10-20 06:10:21
想获取网站文档,查看文档存放路径为相对路径,如href=../img/123.jpg,但是这样的话截取后是不能获得图片的,如何才能获得它的绝对路径,变成href=‘http://www.xxii.com/img/123.jpg’
...全文
153 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
James-CDD 2014-11-06
  • 打赏
  • 举报
回复
问题自己解决: 这个应该是新手会遇到的问题,使用urlparse模块分解URL,再使用join 进行组合,生成完整路径。可以先了解一下这两个模块的用法。
The_Third_Wave 2014-10-20
  • 打赏
  • 举报
回复
一般都是你访问的网页加上href

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧