社区
基础编程
帖子详情
如何获取网页标签内的内容啊 ??
lonelyriver
2010-07-12 11:55:02
比如说 <div class="info">…………………………</div>这对标签内的内容
不过这个div里面有多个div嵌套
要用到正则吗??
先用file_get_contents()获取到网页内容,然后用正则匹配截取吗??
有没有可以直接获取的方法呢??
...全文
411
13
打赏
收藏
如何获取网页标签内的内容啊 ??
比如说 …………………………这对标签内的内容 不过这个div里面有多个div嵌套 要用到正则吗?? 先用file_get_contents()获取到网页内容,然后用正则匹配截取吗?? 有没有可以直接获取的方法呢??
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
13 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Coder_Granger
2010-07-13
打赏
举报
回复
[Quote=引用 12 楼 lonelyriver 的回复:]
引用 11 楼 standford 的回复:
里面有好多DIV标签的最好用DOM,以下是一个例子:<?xml version="1.0" encoding="gb2312"?>
<books>
<book>
<author>aa</author>
<title>bb</title>
<publisher>cc</publisher>
</book>
</books>
……
[/Quote]
html一样是dom结构
lonelyriver
2010-07-13
打赏
举报
回复
[Quote=引用 11 楼 standford 的回复:]
里面有好多DIV标签的最好用DOM,以下是一个例子:<?xml version="1.0" encoding="gb2312"?>
<books>
<book>
<author>aa</author>
<title>bb</title>
<publisher>cc</publisher>
</book>
</books>
p.php内容
<?php
$doc = ne……
[/Quote]
用dom?我说的是html啊 不是xml
standford
2010-07-13
打赏
举报
回复
里面有好多DIV标签的最好用DOM,以下是一个例子:<?xml version="1.0" encoding="gb2312"?>
<books>
<book>
<author>aa</author>
<title>bb</title>
<publisher>cc</publisher>
</book>
</books>
p.php内容
<?php
$doc = new DOMDocument();
$doc->load( 'x.xml' );
$books = $doc->getElementsByTagName( "book" );
foreach( $books as $book )
{
$authors = $book->getElementsByTagName( "author" );
$author = $authors->item(0)->nodeValue;
$publishers = $book->getElementsByTagName( "publisher" );
$publisher = $publishers->item(0)->nodeValue;
$titles = $book->getElementsByTagName( "title" );
$title = $titles->item(0)->nodeValue;
echo "$title - $author - $publisher\n";
}
?>
jianglin28290
2010-07-12
打赏
举报
回复
使用正则匹配字符串
chinajoy2012
2010-07-12
打赏
举报
回复
正则吧
qqshenyunzcz
2010-07-12
打赏
举报
回复
jQuery 不是有个html()方法吗?
dld11111
2010-07-12
打赏
举报
回复
php只能那样了吧
Coder_Granger
2010-07-12
打赏
举报
回复
尽量用处理dom结构的方式获取内容,
正则是万不得已的时候才用的。
CunningBoy
2010-07-12
打赏
举报
回复
正则匹配
如果网页内容是你自己的话,可以在网页上用Ajax提交<div>中的内容给PHP处理。
Dleno
2010-07-12
打赏
举报
回复
字符串里有明显的开始和结尾来区分的,就用正则。
如果比较模糊的那种就用dom xpath来。
如:
****************<div class='1'><div><div><div><div><div><div><div>
<div>gdgfdgdfgfd</div>
<div>gdgfdgdfgfd</div>
<div>gdgfdgdfgfd</div>
<div>gdgfdgdfgfd</div>
</div></div></div></div></div></div></div></div>******************
$dom = new DOMDocument();
$dom->loadHTML( $str );
$xpath = new DOMXPath( $dom );
$el = $xpath->query("//html/body/div[@class='1']");
dingyiding
2010-07-12
打赏
举报
回复
还真不会啊
foolbirdflyfirst
2010-07-12
打赏
举报
回复
php正则没有引入平衡组,其递归能力偏弱,能用dom就用dom吧.
床上等您
2010-07-12
打赏
举报
回复
正则就可以了,不一定需要 dom 来处理。
react方法返回html_如何在React上
获取
html
标签
的值?
我目前正在使用React开发价格
标签
的功能。这些组件的主要功能是让用户将其中一个类的价格添加到购物车中。问题是如何
获取
HTML
标签
的html字符串? 我的示例代码是如何在React上
获取
html
标签
的值?import React from 'react';import ReactDOM from 'react-dom';class ProductPage extends React.Compone...
如何用Python
获取
网页
指定
内容
如何用Python
获取
网页
指定
内容
文章目录如何用Python
获取
网页
指定
内容
1.抓取
网页
源代码2.抓取一个
网页
源代码中的某
标签
内容
3.抓取多个
网页
子
标签
的
内容
Python用做数据处理还是相当不错的,如果你想要做爬虫,Python是很好的选择,它有很多已经写好的类包,只要调用,即可完成很多复杂的功能。 在我们开始之前,我们需要安装一些环境依赖包,打开命令行 确保电脑中具有python和pip,如果没有的话则需要自行进行安装 之后我们可使用pip安装必备模块 pip install requests
C#
获取
指定HTML
网页
中的
标签
内容
首先
获取
网页
内容
: HttpClient client = new HttpClient(); var Result= client.GetStringAsync("http://www.baidu.com/"); Result中的
内容
如何分割呢? 首先可以使用正则表达式的方式,大家可以百度:正则
获取
HTML
标签
内的
内容
本文分享的是另一种方式: 其实
获取
指定页面的
Python
获取
网页
标签
中的全部文本的几种方法
上一篇文章讲述了一下scrapy框架的安装与简单使用,今天呢,就基于scrapy框架来给大家讲述一下如何
获取
网页
标签
中的全部文本。 首先创建一个scrapy框架项目,至于如何创建,不知道的小伙伴们请看我的上一篇文章。 目标是百度贴吧,目标网址:https://tieba.baidu.com/p/4685013359 要求是
获取
发的帖子,当然只要文本。 打开爬虫文件,开始爬取
内容
# -...
python 使用xpath
获取
网页
标签
内容
获取
指定html的
标签
内容
打开
网页
的开发者模式,得到路径
标签
,然后加上/text() 即可得到
标签
的文本
内容
//*[@id="sonsyuanwen"]/div[1]/h1 对于
网页
爬取来说,还是很方便的 # -*- ecoding: utf-8 -*- # @ModuleName: test005 # @Function: # @Author: darling # @Time: 2022...
基础编程
21,891
社区成员
140,347
社区内容
发帖
与我相关
我的任务
基础编程
从PHP安装配置,PHP入门,PHP基础到PHP应用
复制链接
扫一扫
分享
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章