抓取不到数据,高手帮忙!

chaye12 2008-12-23 02:38:58
下面是被采集的网址
http://zoldata.finet.cn/h_stock_data/h_stock.php?code=3838&stock_name=中国淀粉&stock_en_name=CHINA%20STARCH&new_code=03838

我鼠标右键,查看的源代码,如下
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Cache-Control" content="no-store"/>
<meta http-equiv="Pragma" content="no-cache"/>
<meta http-equiv="Expires" content="0"/>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<title></title>

<link href="/css/stock.css" rel="stylesheet" type="text/css" />
<script language="javascript" src="/js/stock_info.js"></script>
<script language="javascript" type="text/javascript">
var stock_code="3838";
var stock_type="hk";
var stock_name="中国淀粉";
var stock_type = '';
$(document).ready(function() {
refresh_s('3838');
window.setInterval("refresh_s('3838')",30000);
});
//show_user_search();
</script>
<script language="javascript" src="/js/stock_function.js"></script>
<script language="javascript" src="/js/commajax.js"></script>
</head>

<div class="Bm_1_1">
<div class="f20" id="chinese_name">中国淀粉 </div>
<div id="english_name">03838被采集的网址.hk (CHINA STARCH)</div>
<div class="r" id="stock_time"></div>
</div>
<div class="Bm_1_2 lv12"><b class="f20" id="stock_last">读取中...</b><br />
<span id="stock_change">0.000</span> (<span id="stock_changerate">0.000</span>)</div>
<ul class="Bm_1_3">
<li>昨收盘:<span id="previous_close">0.000</span></li>
<li>今开盘:<span id="today_open" class="lv12">0.000</span></li>
<li>最高价:<span id="stock_high">0.000</span></li>
<li>最低价:<span id="stock_low">0.000</span></li>
<li>成交额:<span id="stock_turnover">0</span></li>
<li>成交量:<span id="stock_volume">0</span></li>
<li>买入价:<span id="stock_bid">0.000</span></li>
<li>卖出价:<span id="stock_ask" class="ho12">0.000</span> </li>
<li>市盈率:<span id="stock_pe">0.000</span></li>
<li>收益率:<span id="stock_yield">0.000</span></li>
<li>52周最高:<span id="high_52">0.000</span></li>
<li>52周最低:<span id="low_52">0.000</span></li>
</ul>

</body>
</html>


但是前台却显示有数据,0.000的地方一般都是在变化的,请问我如何才能采集到数据?他用的是上面技术?
...全文
189 14 打赏 收藏 转发到动态 举报
写回复
用AI写文章
14 条回复
切换为时间正序
请发表友善的回复…
发表回复
caofan520 2008-12-23
  • 打赏
  • 举报
回复
JS下载下来肯定要改的
我的HTML代码直接放上去可以的吧
我自己试了可以的
chaye12 2008-12-23
  • 打赏
  • 举报
回复
能不能隔一段时间取一下那个网站的一些数据呢?
chaye12 2008-12-23
  • 打赏
  • 举报
回复
把HTML放上不大行,JS下载下来取值的时候还是圈取到的0.000,晕
fenyuxiao 2008-12-23
  • 打赏
  • 举报
回复
关注!!!!!!!
caofan520 2008-12-23
  • 打赏
  • 举报
回复
或者把他的JS下载下来
AJAX请求的时候把他请求的URL修改下就OK了
caofan520 2008-12-23
  • 打赏
  • 举报
回复
把这个HTML放到你网站上
样式自己改

<html xmlns="http://www.w3.org/1999/xhtml">
<head>


<link href="http://zoldata.finet.cn/css/stock.css" rel="stylesheet" type="text/css" />
<script language="javascript" src="http://zoldata.finet.cn/js/stock_info.js"></script>
<script language="javascript" type="text/javascript">
var stock_code="3838";
var stock_type="hk";
var stock_name="中国淀粉";
var stock_type = '';
$(document).ready(function() {
refresh_s('3838');
window.setInterval("refresh_s('3838')",30000);
});
</script>
<script language="javascript" src="http://zoldata.finet.cn/js/stock_function.js"></script>
<script language="javascript" src="http://zoldata.finet.cn/js/commajax.js"></script>

</head>
<body>
<ul class="Bm_1_3">
<li>昨收盘:<span id="previous_close">0.000</span></li>
<li>今开盘:<span id="today_open" class="lv12">0.000</span></li>
<li>最高价:<span id="stock_high">0.000</span></li>
<li>最低价:<span id="stock_low">0.000</span></li>
<li>成交额:<span id="stock_turnover">0</span></li>
<li>成交量:<span id="stock_volume">0</span></li>
<li>买入价:<span id="stock_bid">0.000</span></li>
<li>卖出价:<span id="stock_ask" class="ho12">0.000</span> </li>
<li>市盈率:<span id="stock_pe">0.000</span></li>
<li>收益率:<span id="stock_yield">0.000</span></li>
<li>52周最高:<span id="high_52">0.000</span></li>
<li>52周最低:<span id="low_52">0.000</span></li>
</ul>
</body>
</html>
chaye12 2008-12-23
  • 打赏
  • 举报
回复
他的JS用的是AJAX技术,从另一个网站抓取的信息,然后替换掉<li>里面的内容,我晕,我想我要先搜索下股票接口
caofan520 2008-12-23
  • 打赏
  • 举报
回复
把他JS加上去应该就可以
jfd198512 2008-12-23
  • 打赏
  • 举报
回复
正则表达式 你可以到JAVA 哪里问问大家 ! 顶~
caofan520 2008-12-23
  • 打赏
  • 举报
回复
这样啊,我看下
caofan520 2008-12-23
  • 打赏
  • 举报
回复

string url = "http://zoldata.finet.cn/h_stock_data/h_stock.php?code=3838&stock_name=中国淀粉&stock_en_name=CHINA%20STARCH&new_code=03838";
WebClient webClient = new WebClient();
byte[] b = webClient.DownloadData(url);
string data = Encoding.GetEncoding("gb2312").GetString(b);
Regex reg = new Regex(@"<li>(.*?)</li>");
MatchCollection matches = reg.Matches(data);
for (int i = 0; i < matches.Count; i++)
{
Response.Write(matches[i].Result("$1") + "<br>");
}
webClient.Dispose();
chaye12 2008-12-23
  • 打赏
  • 举报
回复
我的问题是,人家网站页面是有数据的,但是咱抓下来的都是0.000或者是0,
还是没抓到数据!
caofan520 2008-12-23
  • 打赏
  • 举报
回复
不是已经帮你抓了吗
怎么还要抓
这个好象一样的
tian_fang 2008-12-23
  • 打赏
  • 举报
回复
关注

62,046

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧