如何对html代码进行格式化,得到我需要的内容?

qixiang_nj 2006-01-24 11:55:58
例如这段代码:
<TABLE width="100%" border="0" cellPadding="0" cellSpacing="0" xmlns:fo="http://www.w3.org/1999/XSL/Format">
<TR>
<TD height="28">
<font class="h6">高级客户经理
(2人)
</font>
<br>青牛(北京)技术有限公司<A href="#22200200880523">(查看公司信息)</A><br><img src="images/none.gif" width="1" height="3" border="0"></TD>
</TR>
<TR>
<TD>
<TABLE width="98%" border="0" cellPadding="0" cellSpacing="0" bgcolor="#ffffff">
<tr>
<td colspan="3">
<img src="images/none.gif" width="1" height="10" border="0">
</td>
</tr>
<TR>
<TD width="34%">
<font class="h8">
<strong>工作性质:</strong>全职</font>
</TD>
<TD width="34%">
<font class="h8">
<strong>工作地点:</strong>
<INPUT TYPE="hidden" NAME="job_loc" VALUE="杭州">杭州  </font>
</TD>
我希望得到 高级客户经理(2人)、工作性质、工作地点等信息。
望有经验的给个建议。
比较好的方法,欢迎跟贴。
...全文
182 点赞 收藏 8
写回复
8 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
jilu_sun 2006-02-13
借助XML来分析
回复
gxch 2006-02-13
用正则表达式做吧
回复
小乖 2006-02-05
找规律,自己分析阿

看样子是想把人才信息网站的信息资源偷来用?赫赫。。。我们这里有两家公司,我还在考虑把其中的一家公司的所有信息资源都“偷来”自己用呢。。。不会想到一起了吧?

像这样的网页基本上,信息的位置基本上都有一定的规律,找到“名字”“电话”“求职要求”等等信息出现的位置,就直接截取就可以了。用字符串函数了。。。str() instr() pos()等等。。。都是基本的。。。

祝你好运了。。
回复
leonkim 2006-01-24
找到<font class="h6">
然后再找到后边第一个<,取中间的值,得到“高级客户经理(2人)”
然后继续...
回复
fghyxxe 2006-01-24
看完暂时的一个想法:找到<font class="h6">.取后面所要的字符串.然后把前面的字符串删除.重复执行.也就是:取得第一个所要的字符串后.把所取得的字符串前面的全部删除.再去找
回复
qixiang_nj 2006-01-24
请楼上的具体指导,我菜啊。

如何提取这个字符串???
<TR>
<TD height="28">
<font class="h6">高级客户经理
(2人)
</font>
<br>青牛(北京)技术有限公司<A href="#22200200880523">(查看公司信息)</A><br><img src="images/none.gif" width="1" height="3" border="0"></TD>
</TR>
在上面格式的字符串中,如何提取出 高级客户经理(2人) 这样的字符串?<TD height="28">是这个网页代码中唯一的,<font class="h6">则不是唯一。望大家知道下,我急用的。
分不够,下次补!!!
回复
yrb 2006-01-24
需要词法分析的
回复
qixiang_nj 2006-01-24
不行啊,在整个页面中<font class="h6">不止一处的啊。
回复
发动态
发帖子
网络通信/分布式开发
创建于2007-08-02

1566

社区成员

Delphi 网络通信/分布式开发
申请成为版主
社区公告
暂无公告