采集出来的内容是乱码,求转换

y26688 2017-03-21 04:08:08
<?php
$url = "https://rate.tmall.com/list_detail_rate.htm?itemId=524394294771&spuId=341564036&sellerId=100414600&order=3¤tPage=1&append=0&content=1&tagId=&posi=&picture=1&callback=jsonp2339";
$ch2 = curl_init();
curl_setopt($ch2, CURLOPT_URL, $url);
curl_setopt($ch2, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($ch2, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch2, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch2, CURLOPT_RETURNTRANSFER, TRUE);
$texts = curl_exec($ch2);
curl_close($ch2);
//echo $texts;
$pattern = '/"pics"(.+?)","reply"/is';
preg_match_all($pattern, $texts, $match);
for($i=0;$i<count($match[0]);$i++){
$pattern2 = '/"rateContent":"(.+?)."reply"/is';
preg_match($pattern2, $match[0][$i], $matchcomments_only);
echo "<p>".str_replace('","rateDate":"',' ',str_replace('","reply"','',str_replace('"rateContent":"','',$matchcomments_only[0])))."</p>";
}
?>



乱码,我对php不懂,请帮我加个编码转换,谢谢了。
...全文
622 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
傲雪星枫 2017-03-22
  • 打赏
  • 举报
回复
改成这样就可以了

<?php
$url = "https://rate.tmall.com/list_detail_rate.htm?itemId=524394294771&spuId=341564036&sellerId=100414600&order=3¤tPage=1&append=0&content=1&tagId=&posi=&picture=1&callback=jsonp2339";
$ch2 = curl_init();
curl_setopt($ch2, CURLOPT_URL, $url);
curl_setopt($ch2, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($ch2, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch2, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch2, CURLOPT_RETURNTRANSFER, TRUE);
$texts = curl_exec($ch2);
curl_close($ch2);
$texts = iconv('GBK','UTF-8',$texts);

$pattern = '/"pics"(.+?)","reply"/is';
preg_match_all($pattern, $texts, $match);
for($i=0;$i<count($match[0]);$i++){
    $pattern2 = '/"rateContent":"(.+?)."reply"/is';
    preg_match($pattern2, $match[0][$i], $matchcomments_only);
    echo "<p>".str_replace('","rateDate":"',' ',str_replace('","reply"','',str_replace('"rateContent":"','',$matchcomments_only[0])))."</p>";
}
?>
输出:


<p>我好喜欢,看上去逼格高 2017-03-09 13:23:33</p><p>非常喜欢 2017-03-15 20:48:12</p><p>花样亮屏特别好看 就是我太笨了怎么都调不对时间?不过超喜欢 2017-03-05 13:54:07</p><p>朋友见了  特别喜欢  又让我帮他买了一块 很满意呢 2017-03-05 19:33:30</p><p>手表收到了,挺好的,发的时候忘了发手环,卖家补发了货,挺贴心的,祝卖家生意兴隆 2017-03-03 23:16:54</p><p>蛮好的  用了半个月了  只调一次表  到现在还是很准的 2017-03-05 19:31:46</p><p>喜欢生命树图案,大爱 2017-03-06 20:01:25</p><p>好棒啊,可惜有点看不太懂…… 2017-03-04 16:20:14</p><p>帮朋友卖的一个,实在是太好看了,好评,晒的我自己的图 2017-02-19 15:45:29</p><p>手表不错 很喜欢 买了两只  好评 以后还来 2017-02-28 10:56:27</p><p>很不错,看着很漂亮。女朋友很喜欢! 2017-02-22 20:34:54</p><p>朋友很喜欢,很有创意的手表, 2017-02-22 09:24:58</p><p>性价比可以的 已送人 2017-02-28 13:16:26</p><p>挺好的, 2017-02-21 11:31:46</p><p>铁盒有些凸起,不过整体来说还是不错的,上面的时间还需要调,得好好研究研究啊~ 挺炫酷的 2017-02-12 15:29:37</p><p>已经是第二次购买了  第一个送给了弟弟 还是觉得黑色最酷  宝贝非常满意  好评好评 2017-02-14 15:50:23</p><p>包装精美,赠送了备用电池,感应灵敏,简单大气,物有所值,快递也很快,三天就到货了。有需要的朋友可以考虑下噢! 2017-02-15 12:41:14</p><p>宝贝很不错很有特色 同学很喜欢 好评 2017-02-13 12:22:59</p><p>非常酷,送给bf的,开始说看不懂不喜欢,第二天就戴上了,这两天一直戴着,哈哈,喜欢得不得了~ 2017-02-16 19:50:12</p><p>感觉好洋气的赶脚,帮妹妹的朋友买的!非常喜欢…… 2017-02-08 14:56:18</p>
xuzuning 2017-03-21
  • 打赏
  • 举报
回复
返回的是 js 函数调用 jsonp2339({"rgv587_flag":"sm","url":"https://sec.taobao.com/query.htm?action=QueryAction&event_submit_do_css=ok&smApp=tmallrateweb&smPolicy=tmallrateweb-rate-anti_Spider-checklogin&smCharset=GBK&smTag=MjIzLjI0Ny43MS4xMTAsLGExOTEyNmFmMWY4NzRhMGJiYzIyN2IyY2MzMjcxOGIw&smReturn=https%3A%2F%2Frate.tmall.com%2Flist_detail_rate.htm%3Ftbpm%3D3%26itemId%3D524394294771%26spuId%3D341564036%26sellerId%3D100414600%26order%3D3%C3%83%C2%83%C3%82%C2%82%C3%83%C2%82%C3%82%C2%A1%C3%83%C2%83%C3%82%C2%83%C3%83%C2%82%C3%82%C2%A8tPage%3D1%26append%3D0%26content%3D1%26tagId%3D%26posi%3D%26picture%3D1%26callback%3Djsonp2339&smSign=n%2B%2FnQV1sMiGe4BUSk%2BrEdQ%3D%3D"})
伪静态配置参见压缩包中 txt 文件,针对不同环境的有不同配置说明(自带.htacess 文件重新优化了兼容性,解决了 apache+nts 模式下可能出现的“No input file specified.”问题) 安装步骤: 1.将文件解压后上传至相应目录等 2.网站必须配置好伪静态(参考上一步配置),才能正常进行安装和使用(初次访问首页会自动进入安装页面,或手动输入 http://www.域名.com/install) 3.同意使用协议进入下一步检测目录权限 4.检测通过后,填写常规数据库配置项,填写正确即可安装成功,安装成功后会自动进入后台页面 http://www.域名.com/admin,填写安装时输入的后台管理员和密码即可登录 5.在后台文章列表页面,可以进行手动采集文章,和批量采集文章数据。初次安装完毕建议采集一些数据填充网站内容。网站在运行过程中,会自动执行采集操作(需前台访问触发,蜘蛛亦可触发采集),无须人工干预 环境要:PHP5.4 以上,有伪静态功能。推荐配置,php7.1,mysql5.6+ 主机要:IIS/APACHE/NGINX 均可,虚拟主机/VPS/服务器/云服务器均可。推荐使用 linux 系统,apache/nginx 均可 硬件要:CPU/内存/硬盘/宽带大小无要,但配置越高,采集效率会更好! 其他要:如采集目标站服务器在国内,而你的主机在国外,会产生采集效率低的问题。应尽量选择同区域的网站进行采集,美国服务器宜选择机房设在美国的小说站,国内服务器则选择国内站点,以尽可能提升网站速度。 更新提示: 1.增加关键词功能,可批量添加,可自定义 tdk 2.增加广告位管理功能 3.增加百度站内搜索功能,并修复百度结构化数据封面错误的 bug 4.增加图片懒加载功能,可 PC 开启或全站开启或关闭 5.增加小说黑名单、IP 黑名单功能 6.增加作者功能 7.增加指定节点按 ID 采集的功能(范围或指定) 8.友情链接改版,允许同名关键词 9.修复章节内容编辑后乱码问题 10.增加原创功能 11.增加小说按节点批量转换新节点功能,指定小说转换节点功能 12.新增百度主动推送功能 13.新增 singlebiquge 模板,适用于主推单本小说 14.重采功能,如文中出现关键词(正在手打中,可指定关键词)之类的,下次阅读将重新从源站采集 15.章节 url 和缓存中 url 不一致时重新采集内容,以解决换节点导致的章节不对应或源站编辑删除重复章节的问题 16.增加简繁切换功能,并记录 cookies,切换页面自动转换 17.修复栏目页自定义 TDK 无效的问题,增加小说页面单本小说自定义 TDK 18.更换加密方案,新版本使用全新授权文件,旧版本不受影响。后台授权检测间隔调整到 24 小时,以减少授权服务器对用户网站后台的影响 19.增加节点库定义,已入库小说在其他节点遇到也会进入节点库,便于小说切换其他节点。也就意味着,如果你的节点库没有这本小说在新节点的记录,这本小说就无法切换到指定节点。 20.功能模块拆分,便于后续增强 21.修复 sitemap 中时间不显示的 bug,增加对 google 和 https 的兼容 22.其他大量功能优化,不再一一赘述

21,886

社区成员

发帖
与我相关
我的任务
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
  • 基础编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧