社区
数据结构与算法
帖子详情
如何分析html文件,提取出里面包含的所有连接?
rebbie
2001-12-11 06:08:53
关键字(比如src后面跟的就是连接)好还是语法分析的好?
关键字的话无法分析出错误语法页面,语法分析过于复杂....
或许两者都搀杂一点,只对符合的关键字的那一部分做语法分析?
怎么做语法分析?呵,最好有现成的分析例子,拿过来分析分析~~~~
望各位大虾给指点指点~~
小弟就此谢过了?
...全文
107
4
打赏
收藏
如何分析html文件,提取出里面包含的所有连接?
关键字(比如src后面跟的就是连接)好还是语法分析的好? 关键字的话无法分析出错误语法页面,语法分析过于复杂.... 或许两者都搀杂一点,只对符合的关键字的那一部分做语法分析? 怎么做语法分析?呵,最好有现成的分析例子,拿过来分析分析~~~~ 望各位大虾给指点指点~~ 小弟就此谢过了?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
starfish
2001-12-13
打赏
举报
回复
具体一点就看看MSDN的资料
sunnnn
2001-12-12
打赏
举报
回复
能说的具体一点吗?介绍一下这方面的书吧
rebbie
2001-12-12
打赏
举报
回复
哦,谢谢了,我找找相关的资料去,再不行的还得请教请教 ;)
西~~~~
能说一下具体是哪个方法吗?
starfish
2001-12-11
打赏
举报
回复
直接调用ie的html DOM接口就可以了,可以通过里面的方法得到所要求的元素的集合(比如所有联接的集合,所有<p>的集合,etc)
C#常用类库(100多个)
包括
文件
处理、网络通信、HTTP交互、多线程、UI控件、Office文档操作、输入/输
出
(I/O)操作、JSON序列化与反序列化、压缩与解压、文本处理、正则表达式匹配、
HTML
解析、邮件发送、系统信息获取、数据库交互以及加密...
JAVA_API1.6文档(中文)
javax.transaction
包含
解组期间通过 ORB 机制抛
出
的三个异常。 javax.transaction.xa 提供定义事务管理器和资源管理器之间的协定的 API,它允许事务管理器添加或删除 JTA 事务中的资源对象(由资源管理器驱动程序...
MHT富媒体
文件
分析
及
提取
转换
HTML
文件
-Delphi7实现QQ聊天记录导
出
文件
提取
最近需要导
出
QQ群聊天记录,然后批量获取
里面
的图片。看了QQ的导
出
方式一共有三种: 1、加密
文件
(*.bak,支持导入):这个适用于聊天记录备份。 2、网页格式(*.mht,不支持导入):
包含
图片,文字。 3、...
python如何
提取
html
中所有中文
标签中的中文,因为这些通常
包含
的是代码而不是可显示的文本。如果你需要处理这些标签中的文本,你需要添加额外的逻辑来跳过这些标签或单独处理它们。这个正则表达式匹配的是Unicode...注意,这个示例不会
提取
包含
在。
用 Python BeautifulSoup 实现网页链接的
提取
与
分析
本文旨在提供一个全面的指南,介绍如何使用Python的BeautifulSoup库进行网页链接的
提取
与
分析
。
HTML
解析基础链接
提取
技术链接过滤与清洗链接统计
分析
实际应用案例首先介绍BeautifulSoup和
HTML
解析的基础知识然后详细...
数据结构与算法
33,028
社区成员
35,337
社区内容
发帖
与我相关
我的任务
数据结构与算法
数据结构与算法相关内容讨论专区
复制链接
扫一扫
分享
社区描述
数据结构与算法相关内容讨论专区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章