社区
CSS
帖子详情
批量提取网页内容
mitnick1964
2009-03-26 11:15:13
如何能快速提取网页中的链接地址,并输出到一个txt文件中去
网页很多,希望可以批量操作
...全文
324
3
打赏
收藏
批量提取网页内容
如何能快速提取网页中的链接地址,并输出到一个txt文件中去 网页很多,希望可以批量操作
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
coolszy
2009-03-29
打赏
举报
回复
基本方法
先读取网页源代码
然后根据特征查找 URL
保存
shenzhenNBA
2009-03-29
打赏
举报
回复
路过...
好象问题不小啊:1,关键是你用什么来提取,2,是网页是在本地电脑里还是网络中的
mitnick1964
2009-03-26
打赏
举报
回复
希望可以提供直接的工具,我不会编程,谢谢
风越
批量
文本
提取
、网页采集器
批量
提取
HTML/DOC/RTF/TXT等文件中的文本信息。 支持从其它网站直接
提取
文本内容,生成所需数据库文件 支持GB2312/UTF-8多种编码 可将
提取
信息生成文本文件、HTM网页文件、MDB数据库文件。 可设置
提取
文件的间隔,避免下载网页过快,服务器不响应 提供多种查找、获取信息的方式:
提取
文件中全部email邮件地址
提取
文件中全部互联网址(无参数)
提取
文件中全部互联网址(带参数)
提取
HTML文件中body的文本内容
提取
HTML文件中title与body的文本内容
提取
HTML文件中textarea的文本内容
提取
HTML网页的显示文本内容
提取
DOC/RTF等文件中全部文本内容 并可自定义正则表达式获取信息
一个可以
批量
抓取网页图片的工具
本程序可以抓取指定IE窗口中已下载完毕的网页中的全部或部分图片(可根据图片文件后缀和图片所属站点的域名过滤,也可以对单个图片进行选取),对于选中的图片,可以: 1)抓取文件URL列表,可以转换为UBB代码或HTML代码,便于将选中的图片
批量
转贴到支持UBB的论坛 2)另存图片到指定的本地文件夹,另存时可沿用原来的文件名,也可
批量
重命名(类似于ACDSee);对于相同文件名已存在的情况,可以选择跳过、覆盖、重命名或提示;因为是从Internet临时文件夹中复制,所以感觉会很快
批量
获取网站title脚本
批量
获取网站title脚本
风越
批量
提取
文本工具
批量
提取
HTML/DOC/RTF/TXT等文件中的文本信息。 支持从其它网站直接
提取
文本内容,生成所需数据库文件 支持GB2312/UTF-8多种编码 可将
提取
的文本内容生成TXT文本文件、HTM网页文件、MDB数据库文件。 提供多种查找、获取信息的方式:
提取
文件中全部email邮件地址
提取
文件中全部互联网址(无参数)
提取
文件中全部互联网址(带参数)
批量
抓取网站验证码
该项目可以用来抓取网站的验证码
CSS
61,114
社区成员
60,730
社区内容
发帖
与我相关
我的任务
CSS
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
复制链接
扫一扫
分享
社区描述
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章