请问:哪位能给个建议
我的网站是用Apache+php+mysql写的,是在windows的d:\wamp\www下的,
而我的python是安装在虚拟机的linux下的,现在我想从头开始遍历
网站中的各个文件(用open函数),可是不能用d:\wamp\www\index.html,
也不能用http://192.168.1.10/index.html作为文件名。
如果用爬虫,因为我的网站中用用到session等,它的session全局变量
是通过前一个文件传递过来的,所以在用爬虫打开会出错。
请问:如果用payhon遍历全部文件(从index.html开始,然后找到其他链接
文件,然后接着再打开该文件,一步步往下),我该怎么做呢?