高分!PHP网页抓取的问题

ebb 2010-06-03 05:01:28

http://www.zootoo.com/petnews/canineheroesamemorialdaysalute-1612
http://www.zootoo.com/petnews/hailtothecatsasalutetofirstfel-1611
http://www.zootoo.com/petnews/mothersdaygiftsforthepetloving-1592
比如这三个网页
第一个是分页内容，不用管分页
需要把正文部分抓取出来，如何处理？
PHP不是很熟，高分求教，谢谢

...全文

246 7 打赏收藏转发到动态举报

写回复

7 条回复

切换为时间正序

请发表友善的回复…

发表回复

Dleno 2010-06-07

打赏
举报

回复



header("Content-type:text/html;charset=utf-8");

$url="http://www.zootoo.com/petnews/hailtothecatsasalutetofirstfel-1611";  

$contents=file_get_contents($url);

$contents=preg_replace('/>(\s+)/','>',$contents);

$contents=str_replace("\r\n",'',$contents);

$contents=str_replace("\t",'',$contents);

//echo $contents;

preg_match_all('~<div class="f_right" style="width: 175px;">(.*?)</div>(.*?)</div><div class="sep_line1 e_push15"></div>~is',$contents,$p);

print_r($p[1]);

print_r($p[2]);

太久 2010-06-07

打赏
举报

回复

LZ也发我个呗。。

ebb 2010-06-04

打赏
举报

回复

up 一下

ebb 2010-06-03

打赏
举报

回复

eggb4by(AT)yahoo.com.cn，谢谢

jianglin28290 2010-06-03

打赏
举报

回复

留下邮箱，我给你发个例子

ebb 2010-06-03

打赏
举报

回复

我看了下html源码，感觉正则不是很好弄，特别是内容的前面只是一个<div>，请高手指教如何处理
另请附代码，谢谢

liuahuilele 2010-06-03

打赏
举报

回复

用正则
....

本篇把讲解与代码结合，来展示一个小爬虫程序的创建过程。第1步，确立目标。爬取北邮人招生网页上，各年份中北邮在不同省份各个专业的招生人数，对应的最高分，最低分和平均分。第2步，分析网页。北邮人招生网页的网址是： url = 'https:///zsb.bupt.edu.cn/list/list.php?p=5_52_1' 打开网址后看到的是这样的：可以看到，每一个年份都...

reCAPTCHA v3 是自动化系统面临的最具挑战性的障碍之一。随着越来越多的网站实施高级 CAPTCHA 系统来抵御机器人，在 reCAPTCHA v3 中获得高分对于成功的自动化至关重要。本指南将引导您了解有效的策略和 Python 技术，以高分解决 reCAPTCHA v3，确保您的自动化任务顺利运行。

威联通NAS自动更换背景图片2019-12-23 13:45:380点赞5收藏0评论如何才能快速换一种生活方式？参加#牛年Flag#征稿活动，征集你2021年的购物学习生活计划！>>点击查看活动详情<看了值友得文章https://post.smzdm.com/p/andgv3n0/很感兴趣 ,可是我是威联通的NAS,再带的busybox里面的grep没有对应的参数,网上找了一下,...

这段JavaScript代码用于检测用户设备类型，仅允许移动端访问，强制PC端用户跳转到指定页面。代码通过检测屏幕宽度和操作系统平台（Windows/Mac/Linux）实现设备判断，但存在误判高分辨率平板等问题。建议改进方案包括：结合用户代理(UA)检测、屏幕宽度双重验证、添加友好提示替代强制跳转、记录访问日志等。这种方案适用于移动专属页面，但需注意SEO影响和用户绕过限制的可能性，必要时可结合服务器端检测实现更严格的访问控制。

　　上大学以来每年的十一都是我进步最大的时候，记得09年的十一我用了八天时间在宿舍提前学了下java，结果开学后大家看我的眼光顿时就变了，还经常有人问我问题了，我也就装模作样的帮他们解答解答，总之那个十一让我有了一点点的成就感。想当年来软件学院本不是我的意愿，但是没有办法，高分的专业没有考上，只能硬着头皮学自己不感兴趣的专业，我的专业是软件工程，我挂的第一门课就是软件工程，随后虽然没有再挂过，但是...

21,889

社区成员

140,337

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章