社区
网络编程
帖子详情
提取网页部分内容(比如抽取www.sohu.com页面上某个TABLE)并显示出来,怎么做?
Ouyangyifeiczy
2004-07-28 11:32:36
之前看过一些资料,不过俺水平不够,看不懂,多谢各位老大了:)
...全文
106
2
打赏
收藏
提取网页部分内容(比如抽取www.sohu.com页面上某个TABLE)并显示出来,怎么做?
之前看过一些资料,不过俺水平不够,看不懂,多谢各位老大了:)
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
gracezhu
2004-07-29
打赏
举报
回复
使用IhtmlTable
http://search.csdn.net/Expert/topic/351/351580.xml?temp=.9613611
Ouyangyifeiczy
2004-07-29
打赏
举报
回复
多谢
用htmlparser分析并
抽取
正文
因为如果不能很好的
提取
原有文章的
内容
和样式,那么搜索出来的东西 就会惨不忍睹.根本就没有使用价值 在
做
正文
抽取
模块之前我曾经参考过很多
抽取
模式,有配置模版的,有搞视觉匹配的.有搞关键字识别的.我...
网页
正文
提取
的思路
网页
由于格式千变万化,要找到一种能
提取
任意
网页
正文的算法,并能达到应用需要的准确度,具有一定难度。因此,总避免不了在
提取
程序中添加一些规则,对不同的
网页
类型作不同处理。另外,有人利用开源的Tidy,把不...
网页
正文
提取
网页
由于格式千变万化,要找到一种能
提取
任意
网页
正文的算法,并能达到应用需要的准确度,具有一定难度。因此,总避免不了在
提取
程序中添加一些规则,对不同的
网页
类型作不同处理。另外,有人利用开源的Tidy,把不...
搜索引擎当前主流正文
提取
的思路
网页
由于格式千变万化,要找到一种能
提取
任意
网页
正文的算法,并能达到应用需要的准确度,具有一定难度。因此,总避免不了在
提取
程序中添加一些规则,对不同的
网页
类型作不同处理。另外,有人利用开源的Tidy,把不...
htmlparser 的使用 原文网址:http://
www
.iteye.
com
/topic/149493
因为如果不能很好的
提取
原有文章的
内容
和样式,那么搜索出来的东西 就会惨不忍睹.根本就没有使用价值 在
做
正文
抽取
模块之前我曾经参考过很多
抽取
模式,有配置模版的,有搞视觉匹配的.有搞关键字识别的.我...
网络编程
18,356
社区成员
64,214
社区内容
发帖
与我相关
我的任务
网络编程
VC/MFC 网络编程
复制链接
扫一扫
分享
社区描述
VC/MFC 网络编程
c++
c语言
开发语言
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章