社区
基础编程
帖子详情
如何获取网页标签内的内容啊 ??
lonelyriver
2010-07-12 11:55:02
比如说 <div class="info">…………………………</div>这对标签内的内容
不过这个div里面有多个div嵌套
要用到正则吗??
先用file_get_contents()获取到网页内容,然后用正则匹配截取吗??
有没有可以直接获取的方法呢??
...全文
404
13
打赏
收藏
如何获取网页标签内的内容啊 ??
比如说 …………………………这对标签内的内容 不过这个div里面有多个div嵌套 要用到正则吗?? 先用file_get_contents()获取到网页内容,然后用正则匹配截取吗?? 有没有可以直接获取的方法呢??
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
13 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Coder_Granger
2010-07-13
打赏
举报
回复
[Quote=引用 12 楼 lonelyriver 的回复:]
引用 11 楼 standford 的回复:
里面有好多DIV标签的最好用DOM,以下是一个例子:<?xml version="1.0" encoding="gb2312"?>
<books>
<book>
<author>aa</author>
<title>bb</title>
<publisher>cc</publisher>
</book>
</books>
……
[/Quote]
html一样是dom结构
lonelyriver
2010-07-13
打赏
举报
回复
[Quote=引用 11 楼 standford 的回复:]
里面有好多DIV标签的最好用DOM,以下是一个例子:<?xml version="1.0" encoding="gb2312"?>
<books>
<book>
<author>aa</author>
<title>bb</title>
<publisher>cc</publisher>
</book>
</books>
p.php内容
<?php
$doc = ne……
[/Quote]
用dom?我说的是html啊 不是xml
standford
2010-07-13
打赏
举报
回复
里面有好多DIV标签的最好用DOM,以下是一个例子:<?xml version="1.0" encoding="gb2312"?>
<books>
<book>
<author>aa</author>
<title>bb</title>
<publisher>cc</publisher>
</book>
</books>
p.php内容
<?php
$doc = new DOMDocument();
$doc->load( 'x.xml' );
$books = $doc->getElementsByTagName( "book" );
foreach( $books as $book )
{
$authors = $book->getElementsByTagName( "author" );
$author = $authors->item(0)->nodeValue;
$publishers = $book->getElementsByTagName( "publisher" );
$publisher = $publishers->item(0)->nodeValue;
$titles = $book->getElementsByTagName( "title" );
$title = $titles->item(0)->nodeValue;
echo "$title - $author - $publisher\n";
}
?>
jianglin28290
2010-07-12
打赏
举报
回复
使用正则匹配字符串
chinajoy2012
2010-07-12
打赏
举报
回复
正则吧
qqshenyunzcz
2010-07-12
打赏
举报
回复
jQuery 不是有个html()方法吗?
dld11111
2010-07-12
打赏
举报
回复
php只能那样了吧
Coder_Granger
2010-07-12
打赏
举报
回复
尽量用处理dom结构的方式获取内容,
正则是万不得已的时候才用的。
CunningBoy
2010-07-12
打赏
举报
回复
正则匹配
如果网页内容是你自己的话,可以在网页上用Ajax提交<div>中的内容给PHP处理。
Dleno
2010-07-12
打赏
举报
回复
字符串里有明显的开始和结尾来区分的,就用正则。
如果比较模糊的那种就用dom xpath来。
如:
****************<div class='1'><div><div><div><div><div><div><div>
<div>gdgfdgdfgfd</div>
<div>gdgfdgdfgfd</div>
<div>gdgfdgdfgfd</div>
<div>gdgfdgdfgfd</div>
</div></div></div></div></div></div></div></div>******************
$dom = new DOMDocument();
$dom->loadHTML( $str );
$xpath = new DOMXPath( $dom );
$el = $xpath->query("//html/body/div[@class='1']");
dingyiding
2010-07-12
打赏
举报
回复
还真不会啊
foolbirdflyfirst
2010-07-12
打赏
举报
回复
php正则没有引入平衡组,其递归能力偏弱,能用dom就用dom吧.
床上等您
2010-07-12
打赏
举报
回复
正则就可以了,不一定需要 dom 来处理。
JSP中JSTL
标签
库实操极简入门
内容
包括: JSTL
标签
库的使用-1-环境准备 JSTL
标签
库的使用-2-c
标签
中的out JSTL
标签
库的使用-3-c
标签
中的set JSTL
标签
库的使用-4-c
标签
中的remove JSTL
标签
库的使用-5-c
标签
中的catch JSTL
标签
库的使用-6-c
标签
中的...
如何用Python
获取
网页
指定
内容
抓取一个
网页
源代码中的某
标签
内容
3.抓取多个
网页
子
标签
的
内容
Python用做数据处理还是相当不错的,如果你想要做爬虫,Python是很好的选择,它有很多已经写好的类包,只要调用,即可完成很多复杂的功能。 在我们开始...
python 使用xpath
获取
网页
标签
内容
获取
指定html的
标签
内容
打开
网页
的开发者模式,得到路径
标签
,然后加上/text() 即可得到
标签
的文本
内容
//*[@id="sonsyuanwen"]/div[1]/h1 对于
网页
爬取来说,还是很方便的 # -*- ecoding: utf-8 -*- # @ModuleName:...
C#
获取
指定HTML
网页
中的
标签
内容
首先
获取
网页
内容
: HttpClient client = new HttpClient(); var Result= client.GetStringAsync("http://www.baidu.com/"); Result中的
内容
如何分割呢? 首先可以使用正则表达式的方式,大家可以百度:...
Python
获取
网页
标签
中的全部文本的几种方法
上一篇文章讲述了一下scrapy框架的安装与简单使用,今天呢,就基于scrapy框架来给大家讲述一下如何
获取
网页
标签
中的全部文本。 首先创建一个scrapy框架项目,至于如何创建,不知道的小伙伴们请看我的上一篇文章。 ...
基础编程
21,886
社区成员
140,364
社区内容
发帖
与我相关
我的任务
基础编程
从PHP安装配置,PHP入门,PHP基础到PHP应用
复制链接
扫一扫
分享
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章