如何用Python爬取动态加载的网页数据
暗夜老猫 2015-04-01 03:17:52 之前做过一个爬取一年之内最高气温的python程序。这个程序的网页是静态的,只需要通过循环访问365个html,然后找到每个网页中的最高气温那个标签就可以实现了。
那么问题来了,像京东、人人这样的网站,只有在鼠标滑轮到达最底部时,才会继续加载新的数据出来,那么这些数据怎么爬到?(我试过了,及时滑动到最底部加载出新的数据,网页的源码也还是不变的。。)
或者说,如何把动态加载的数据(还未加载出来)也在该html文件中显示出来?
我是html菜鸟,求大神指点,不胜感激~~