如何抓取动态网页的内容?

walkuere 2017-11-02 04:50:22
我要抓取的是这里的内容
http://www.cninfo.com.cn/information/companyinfo_n.html?brief?szsme002259
用传统的读取读取不到我要的信息,因为读取到的是查看源代码的内容,和浏览器f12显示的不一样

用的python3
都写好了,如果实在不行我只有转JAVA,不知该怎么弄
好像是说抓取JS执行之后的内容
...全文
201 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
walkuere 2017-11-02
  • 打赏
  • 举报
回复
引用 1 楼 qq_32661557 的回复:
使用了iframe 抓取http://www.cninfo.com.cn/information/brief/szsme002259.html
那请问我遇到这样,如何找到他们的数据实际地址呢? 我还有几个其他的要找,比如 http://www.sse.com.cn/assortment/stock/list/info/company/index.shtml?COMPANY_CODE=600036 还有股本结构 http://www.sse.com.cn/assortment/stock/list/info/capital/index.shtml?COMPANY_CODE=600036 这样我就不用搞phatomjs或者htmlunit了 因为最新的python3 pip install PhatomJS失败,我也不知道怎么弄
walkuere 2017-11-02
  • 打赏
  • 举报
回复
引用 1 楼 qq_32661557 的回复:
使用了iframe 抓取http://www.cninfo.com.cn/information/brief/szsme002259.html
哦太感谢了!!谢谢,我加点分
本人QQ-554433626 2017-11-02
  • 打赏
  • 举报
回复

10,606

社区成员

发帖
与我相关
我的任务
社区描述
Web 开发 其他
社区管理员
  • 其他
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧