在做抓取网页数据的大作业,求教这里怎么处理
想抓取这个网页里http://www.jisilu.cn/data/sfnew/#tlink_3 A类,B类,母基,分级套利,母基可交易分级里面表格的数据
查了点资料对HTML有了点了解后,这几张表格是动态生成的,相关的代码大概是这样的吧。。。?
<table id="flex3" style="display:none;min-width:1500px;" class="tablesorter"></table>
</div>
<div id="topic_2" style="display:none">
<table id="flex2" style="display:none;min-width:1350px;" class="tablesorter"></table>
</div> //这个是B类的表格位置
<div id="topic_1" style="display:none">
<table id="flex1" style="display:none;min-width:1350px;" class="tablesorter"></table>
</div> //这个是母基表格位置
好像是用这个来生成的? <script type="text/javascript" src="/static/js/app/data_sf.js?v=20150821"></script>
在CHROME里按F12后,和<table id="flex2" style="display:none;min-width:1350px;" class="tablesorter"></table>
相似的几个语句下面增加了一大堆的HTML语句,里面就包含里想要抓取的 表格 的HTML代码。
想求教增加的那一堆HTML代码到底应该怎么去抓取到。。。晕了