请教高手-网页采集问题
比如我想采集一个网站的数据,该网站把用户分成两类,一类是游客,一个是注册会员,有一部分信息游客是无法看到的,只有注册会员才能看到
我采集数据时,如何模拟出已经登录的状态。
即使在本地登录了,也没有用
<?php
function getFieldValue($regExt,$str)
{
preg_match_all($regExt, $str, $jf, PREG_SET_ORDER);
return $jf[0][1];
}
error_reporting(E_ALL ^ E_NOTICE ^ E_WARNING);
$id=$_REQUEST['id'];
$url = "http://www.91yuan.com/operate/userview/user_basicinfo.asp?id_r=1273128&levels=";
$str = file_get_contents($url);
//echo $str;
$regExt = "/<font color=\'.+\'>QQ :<\/font><font color=\'.+\'>(.+)<\/font><br>/isU";
$intro = getFieldValue($regExt,$str);
echo "QQ = ".$intro."<br>";
?>
这样采集出来的结果是:QQ = 银卡/金卡会员可见
而实际情况是 QQ = 757224019
我怀疑是因为SESSION或COOKIE的问题
请问在采集时如何带上网站的SESSION或COOKIE?