社区
CSS
帖子详情
想抓取html中一段内容,有现成的开源软件包吗
big_world
2011-07-17 10:45:02
看了这些html格式固定的,想抓取其中一段内容。想自己写代码解析html中的tag以读取内容。
不知道有没现成的工具或者开源软件包啊
...全文
93
10
打赏
收藏
想抓取html中一段内容,有现成的开源软件包吗
看了这些html格式固定的,想抓取其中一段内容。想自己写代码解析html中的tag以读取内容。 不知道有没现成的工具或者开源软件包啊
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
10 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
big_world
2011-07-17
打赏
举报
回复
多谢,我也这么理解的,看了一楼的回复觉得很迷惑。我自己实现了解析的,主要是不懂html语法,解析总是不对,原来是注释。多谢
[Quote=引用 6 楼 aspwebchh 的回复:]
js抓不了别人的。
去学点服务器端技术,如asp,asp.net
就可以抓了
至于开发包什么的,你网上搜搜看。这些东西以经很简单了,没必要再加工了
asp可以用 MSXML2.XMLHTTP 组件
.net更方便 直接使用类型 WebRequest WebResponse
[/Quote]
big_world
2011-07-17
打赏
举报
回复
年轻人就喜欢下结论,傻逼
[Quote=引用 7 楼 theforever 的回复:]
引用楼主 big_world 的回复:
想自己写代码解析html中的tag以读取内容。
不知道有没现成的工具或者开源软件包啊
又想自己写,又要用现成工具,这不矛盾吗。就是想把别人成果换成自己名字?
不会就学,没什么可说的,如果没有技术人的基本特征,就没什么可说的了。
[/Quote]
itakeblue
2011-07-17
打赏
举报
回复
js/asp等都能实现,xmlhttp抓取网页并分析,网上很多搜索下
big_world
2011-07-17
打赏
举报
回复
js是基于浏览器的,抓自己嵌入的网页内容很简单,我是搞不明白抓已经生成的网页是如何设计的,请高人赐教。如果你懂的话。否则........[Quote=引用 4 楼 lsw645645645 的回复:]
引用 2 楼 big_world 的回复:
我想抓取别人生成好的网页,我没做过web开发,不过如果js实现方便,可以讲解一下思路,我自己实现
没做过web开发。跟你说了,你也不懂啦。
[/Quote]
碧海情天-赵亮
2011-07-17
打赏
举报
回复
[Quote=引用楼主 big_world 的回复:]
想自己写代码解析html中的tag以读取内容。
不知道有没现成的工具或者开源软件包啊
[/Quote]
又想自己写,又要用现成工具,这不矛盾吗。就是想把别人成果换成自己名字?
不会就学,没什么可说的,如果没有技术人的基本特征,就没什么可说的了。
big_world
2011-07-17
打赏
举报
回复
我想抓取别人生成好的网页,我没做过web开发,不过如果js实现方便,可以讲解一下思路,我自己实现[Quote=引用 1 楼 xiaodalei 的回复:]
在js里倒是可以实现啊。这个需要吗?
[/Quote]
xiaodalei
2011-07-17
打赏
举报
回复
在js里倒是可以实现啊。这个需要吗?
挨踢直男
2011-07-17
打赏
举报
回复
js抓不了别人的。
去学点服务器端技术,如asp,asp.net
就可以抓了
至于开发包什么的,你网上搜搜看。这些东西以经很简单了,没必要再加工了
asp可以用 MSXML2.XMLHTTP 组件
.net更方便 直接使用类型 WebRequest WebResponse
Cyril851122
2011-07-17
打赏
举报
回复
perl
lsw645645645
2011-07-17
打赏
举报
回复
[Quote=引用 2 楼 big_world 的回复:]
我想抓取别人生成好的网页,我没做过web开发,不过如果js实现方便,可以讲解一下思路,我自己实现
[/Quote]
没做过web开发。跟你说了,你也不懂啦。
从零制作视觉
抓取
机械臂实物系列:一、让机械臂实物动起来(1)
视觉机械臂整体介绍课程介绍
抓取
流程框架硬件简介 课程介绍 大家好,我是拿笔小新的新。上课之前我们得明白学这门课能学到啥知识,以及学完了之后我们可以做个什么东西出来。预备知识:很简单的线性代数矩阵知识以及windows下安装软件的能力即可。 你将学会: 最基本的视觉机械臂
抓取
的流程 如何用串口与机械臂通讯 变换矩阵、DH参数法建立机械臂模型、几何法建立机械臂模型以及运动学逆解 3种常用自由度机械臂的使用(3、4、6DOF) opencv-python的简单使用以及简单的目标检测示例 简单的手眼标定 如何
GitHub上最全的.NET 学习、
开源
项目、工具大全
内容
一般框架, 库和工具API应用程序框架应用程序模板身份认证和授权区块链机器人自动部署css, js帮助工具缓存
内容
管理系统CMS代码分析和指标压缩编译器密码数据库数据库驱动程序数据库工具库日期和时间分布式计算电子商务与计算异常响应式编程图片图形用户界面GUI集成开发环境IDE国际化控制反转IOC日志机器学习和科学研究邮件数学网络大杂烩办公软件对象关系映射ORM分析消息队列sql生成器任务计划开...
关于API安全以及
开源
测试工具
API(ApplicationProgramming Interface)允许应用程序彼此交互,是现代软件模式的基本组成部分,例如微服务架构。由于API很常用且可以访问敏感的软件功能和数据,因此它们正成为攻击者的主要目标。API安全已成为现代web应用安全的关键组成部分。API可能存在诸如身份验证和授权失效、缺乏限速以及代码注入等漏洞,组织必须定期测试API来识别漏洞,并使用安全最佳实践来解决这些漏洞。
Linux
软件包
源码编译安装实战
从名字上看,老的 unix 系统的 CC 程序叫做 C Compiler。但 GCC 这个名字按 GNU 的说法叫做 Gnu Compiler Collection。因为 gcc 包含很多编译器 (C, C++, Objective-C, Ada, Fortran,and Java)。所以它们是不一样的,一个是一个古老的 C 编译器,一个是编译器的 GNU 的编译器的集合 (Gcc 里的 C 编译器比 CC 强大太多了,所以你没必要用 CC)。
从技术上解读大数据的应用现状和
开源
未来
来源:网络大数据作者 | 韩锐、 Lizy Kurian John、詹剑锋摘要:近年来,随着大数据系统的快速发展,各式各样的
开源
基准测试集被开发出来,以评测和分析大数据系...
CSS
61,115
社区成员
60,728
社区内容
发帖
与我相关
我的任务
CSS
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
复制链接
扫一扫
分享
社区描述
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章