[D]python如何判断2个url是否属于同一网站?
给出2个url,如何判断他们是不是同一个网站,我本来想用urlparse模块,用它的hostname判断,可是这样一来就出现判断失误,比如说http://www.sina.com和http://blog.sina.com如果比较hostname就不是一个网站,我想写一个脚本爬新浪的网页,解析页面后我要排除指向外站的链接,不知有没有什么好的方法,谢谢
----------------------------
Double行动:
原帖分数:30
加分:30