PHP搜索特定页面关键词问题!这个问题难不难?难!不难!难?不难?难!不难!难?不难?难!不难!难?不难?难!不难!难?不难?……

neverdead 2006-10-23 11:28:16
给定一个网页parent.htm,在此网页上有N(N<30)个超链接,超链接指向的页面分别是son1.htm, son2.htm,...,sonN.htm.
那么,怎么根据指定的parent.htm找到son1.htm, son2.htm,...,sonN.htm上的关键字(keyword) ?
...全文
454 21 打赏 收藏 转发到动态 举报
写回复
用AI写文章
21 条回复
切换为时间正序
请发表友善的回复…
发表回复
neverdead 2006-10-30
  • 打赏
  • 举报
回复
弄好了,凑合着能用啦~~
ricky lyu 2006-10-28
  • 打赏
  • 举报
回复
用正则!
Dereky 2006-10-28
  • 打赏
  • 举报
回复
分一半 750米出来 哈哈
「已注销」 2006-10-28
  • 打赏
  • 举报
回复
很容易的啦``用sqlite 把抓到的数据全部插入到数据库 跟着再写一个读取的 非常简单 ··```
椅子 2006-10-27
  • 打赏
  • 举报
回复
得到任务列表

循环体开始
下载任务1
html分析,抓取内容,具体问题具体分析,容易的是固定格式的,比如sina的新闻
保存回数据库
完成任务1
循环体结束

neverdead 2006-10-27
  • 打赏
  • 举报
回复
掉的好快
neverdead 2006-10-26
  • 打赏
  • 举报
回复
楼上的红五星大哥,把您的代码贴出来让偶也瞧瞧嘛,让我少走点弯路^_^
椅子 2006-10-26
  • 打赏
  • 举报
回复
补充,和php无关
因为小偷把东西偷到后,放数据库里了,你用就去取
椅子 2006-10-26
  • 打赏
  • 举报
回复
别人出1500让我做的。指定搜索某网站,抓取内容

你的问题的术语叫:新闻小偷。
zeroleonhart 2006-10-26
  • 打赏
  • 举报
回复
只能显示一个链接,接下去就死循环了

--------------------------------------------
那是你程序的问题
neverdead 2006-10-26
  • 打赏
  • 举报
回复
to angel0829(复活):
只能显示一个链接,接下去就死循环了
myvicy 2006-10-24
  • 打赏
  • 举报
回复
哈,你还在的啊。
问题是你要怎么样找呢?在文档找还是当作字符串来处理?
neverdead 2006-10-24
  • 打赏
  • 举报
回复
怎么做呢?我一点头绪都没有~~达人,给个相关链接吧~源码最好^_^
myvicy 2006-10-24
  • 打赏
  • 举报
回复
用js来做。
neverdead 2006-10-24
  • 打赏
  • 举报
回复
来个实例吧,我想把http://shop33876956.taobao.com/上的所有宝贝的名称和价格罗列出来,那“http://shop33876956.taobao.com/”就是我所说的parent.htm;在这个页面上有指向每个宝贝的链接,比如“http://auction1.taobao.com/auction/1801/item_detail-0db2-c6fe8e07ca9cab8ce6602fb2e83469f1.jhtml”,这个就是我所说的sonN.htm。
而我指的关键字“珀莱·祛痘霜”和“一 口 价:25.60元 ”就在这个页面上。
我想通过程序,把这个页面“http://auction1.taobao.com/auction/1801/item_detail-0db2-c6fe8e07ca9cab8ce6602fb2e83469f1.jhtml”上的宝贝名称“珀莱·祛痘霜”和一口价“25.60元”取出来存放在数据库(sql,文本等)中。怎么实现阿?
angel0829 2006-10-24
  • 打赏
  • 举报
回复
<?
$url = "http://localhost/parent.htm";
$page = fopen($url, "r");

print("Links at $url<br>\n");
print("<ul>\n");

while(!feof($page)){
$line = fgets($page, 1024);
while(ereg("href=\"[^\"]*\"", $line, $match)){
print("<li>");
print($match[0]);
print("<br>\n");
$replace = ereg_replace("\?", "\?", $line);
}
}
print("</ul>\n");
fclose($page);
?>

这个可以找出所有你想要的parent.htm里的链接。
后面那个什么keyword不明白楼主什么意思
an9ryfr09 2006-10-24
  • 打赏
  • 举报
回复
用file_get_contents($filename)读取页面,然后用正则或者html dom来解析keyword,思路已经给你了,剩下的就是查查函数,写逻辑语句的问题了。
懒得去死 2006-10-24
  • 打赏
  • 举报
回复
<script>
<a href href="son"+i+".html"> * </a>
</script>
天降大任于斯 2006-10-24
  • 打赏
  • 举报
回复
把parent.htm读到本地,当成字符串
匹配<a href...> * </a>
myvicy 2006-10-24
  • 打赏
  • 举报
回复
用正则。
先得到页面的串,然后把非/<a(.*)\/a>/的都删除掉,然后在拆分吧......
加载更多回复(1)

21,886

社区成员

发帖
与我相关
我的任务
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
  • 基础编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧