在JS中用正则获取HTML中相关信息问题

bengo420 2008-12-24 09:58:27
<div class="summary">
<div class="imgDiv" style="float:left"> <a href="n145c74.aspx" class="imgLink"> <img src="upload/2008-12/08121915161144t.jpg" alt="江铃第十三届职工大合唱比赛综述" width="280" height="210"/> </a> </div>
<div class="cont">
<div class="title"> <a href="n145c74.aspx" class="nLink" >江铃第十三届职工大合唱比赛综述 </a> </div>
<div class="sum"> <span style="font-size: 14pt; color: #333333; font-family: 仿宋_GB2312; mso-hansi-font-family: 宋体; mso-bidi-font-family: Arial;">秋风送爽,丹桂飘香,在这收获的季节里,隆重纪念中国改革开放三十周年及江铃第十三届职工大合唱红歌比赛于 <span lang="EN-US">9 </span>月 <span lang="EN-US">27 </span>日晚在江铃体育场拉开了帷幕。 </span> </div>
<div class="foot">
<div style="float:right"> <a href="n145c74.aspx" >[查看全文] </a> </div>
日期: <span>12月19日 </span> </div>
</div>
</div>
<div class="summary">
<div class="hr"> </div>
<div class="imgDiv" style="float:left"> <a href="n144c74.aspx" class="imgLink"> <img src="upload/2008-12/08121915183633t.jpg" alt="江铃隆重举行车辆装配工技能大赛" width="280" height="210"/> </a> </div>
<div class="cont">
<div class="title"> <a href="n144c74.aspx" class="nLink" >江铃隆重举行车辆装配工技能大赛 </a> </div>
<div class="sum"> <span style="font-family: 仿宋_GB2312;"> <span lang="EN-US"> <span style="font-family: 仿宋_GB2312;">由江铃汽车集团公司工会主办,合资总装厂、股份全顺厂、控股昌北工厂承办的纪念改革开放三十周年公司技术工人协会车辆装配工技能大赛在合资厂拉开帷幕。 <span lang="EN-US">11 </span>月 <span lang="EN-US">11 </span>日上午,举行了隆重的开幕暨江铃技术工人协会分会的授牌仪式,公司领导吴涌、刘年风、市总工会副主席李美珍出席仪式。 <span lang="EN-US"> </span> </span> </span> </span> </div>
<div class="foot">
<div style="float:right"> <a href="n144c74.aspx" >[查看全文] </a> </div>
日期: <span>12月19日 </span> </div>
</div>
</div>
<div class="summary">
<div class="hr"> </div>
<div class="imgDiv" style="float:left"> <a href="n143c74.aspx" class="imgLink"> <img src="upload/2008-12/08122214459917t.jpg" alt="中华全国总工会副主席王炯考察江铃" width="280" height="210"/> </a> </div>
<div class="cont">
<div class="title"> <a href="n143c74.aspx" class="nLink" >中华全国总工会副主席王炯考察江铃 </a> </div>
<div class="sum">  </div>
<div class="foot">
<div style="float:right"> <a href="n143c74.aspx" >[查看全文] </a> </div>
日期: <span>12月19日 </span> </div>
</div>
</div>
</div>

里面是3个段落,我要把URL,IMG,title,以及 <div class="sum"> </div> 之间的内容取出来,日期,该怎么写啊,谢谢

如查找URL,则规律为以 <div class="imgDiv" style="float:left"> <a href=" 开头,以" class="imgLink"> 结尾,写一个这样的正则表达式则就可以查出 一个 URL 数组;

然后再查IMG,规律为以<img src="开头,以 alt=".*" width="280" height="210"/></a>结尾,就可以查出一个IMG地址的数组;

Title,规律为以 <div class="title"> 开头,以</div> 结尾,如果能直接查到里面的文字更好

简介,规律以 <div class="sum"> 开头,以</div>结尾

该怎么写啊,谢谢啦!
望高人解答,谢谢啦 急!!!!!!
...全文
249 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
zhairongyu 2008-12-24
  • 打赏
  • 举报
回复
第一个问题:如查找URL,则规律为以 <div class="imgDiv" style="float:left"> <a href=" 开头,以" class="imgLink"> 结尾,写一个这样的正则表达式则就可以查出 一个 URL 数组;
(?<=<div class=\"imgDiv\" style=\"float:left\"> <a href=\")[^=]*(?=class=\"imgLink\">)
第二个问题:然后再查IMG,规律为以 <img src="开头,以 alt=".*" width="280" height="210"/> </a>结尾,就可以查出一个IMG地址的数组;
(?<=alt=\".*\" width=\"280\" height=\"210\"/>)[^=]*(?=</a>)
第三个问题:Title,规律为以 <div class="title"> 开头,以 </div> 结尾,如果能直接查到里面的文字更好
(?<=<div class=\"title\">)[^=]*(?=</div>)
第四个问题:简介,规律以 <div class="sum"> 开头,以 </div>结尾
(?<=<div class=\"sum\">)[^=]*(?=</div>)

QQ:17479808
第1章(\1) 示例描述:变量。 1_1.htm 变量声明。 1_2.htm 局部变量和全局变量。 1_3.htm JavaScript的强制类型转换。 1_4.htm 在HTML为JavaScript传递变量。 1_5.htm 在HTML引用JavaScript的变量。 1_6.htm 比较undefined和"undefined"。 第2章(\2) 示例描述:客户端的流程控制。 2_1.htm 条件判断语句if…else 2_2.htm 多条件判断语句switch。 2_3.htm 嵌套循环语句for。 2_4.htm 循环语句while。 2_5.htm 控制循环过程break和continue。 2_6.htm 利用流程控制语句实现冒泡排序。 第3章(\3) 示例描述:字符串操作。 3_1.htm 连接字符串。 3_2.htm 在字符串查找指定字符。 3_3.htm 提取字符串的字串。 3_4.htm 替换字符串的指定字符。 3_5.htm 将字符串分解为数组。 3_6.htm 字符串大小写的书写和判断。 第4章(\4) 示例描述:数组技术。 4_1.htm 创建空数组。 4_2.htm 创建带初始值的数组。 4_3.htm 将数组转换为字符串。 4_4.htm 遍历数组的元素。 4_5.htm 合并两个数组。 4_6.htm 创建多维数组。 4_7.htm 数组排序。 第5章(\5) 示例描述:JavaScript快速处理日期时间的操作。 5_1.htm 获取当前日期并显示在HTML。 5_2.htm 分别获取当前时间的年月日时分秒。 5_3.htm 时间的水倒影。 5_4.htm 简单的日历。 5_5.htm 标题栏显示日期。 5_6.htm 标题栏显示时间。 5_7.htm 不同时间的不同问候。 第6章(\6) 示例描述:JavaScript页面处理技巧。 6_1.htm 用JavaScript实现一个页面两份样式表。 6_2.htm 用JavaScript动态更换图像元素的图像。 6_3.htm 利用搜索引擎引用来高亮页面关键字。 6_4.htm 使用匿名函数为定时器传递参数。 6_5.htm Web页面的tooltip提示。 6_6.htm 在Web页面控制其元素的选择状态。 第7章(\7) 示例描述:JavaScript的鼠标事件和键盘事件。 7_1.htm 按钮的鼠标单击事件。 7_2.htm 用鼠标点亮文本。 7_3.htm 渐显图片。 7_4.htm 跟随鼠标的图片。 7_5.htm 跟随鼠标的*。 7_6.htm 跟随鼠标的文字。 7_7.htm 判断Ctrl键是否被按下。 7_8.htm 设置页面某按钮的热键。 第8章(\8) 示例描述:窗口大小自动化管理。 8_1.htm 按指定要求打开的窗口。 8_2.htm 控制窗口的打开和关闭。 8_3.htm 从天而降的窗口。 8_4.htm 打开慢慢变大的窗口。 8_5.htm 打开一个四面变大的窗口。 8_6.htm 页面左右分开。 8_7.htm 定时打开网页。 8_8.htm 自动打开新的窗口。 第9章(\9) 示例描述:JavaScript结合文字实现特殊页面。 9_1.htm 逐隐逐现的文字特效。 9_2.htm 超酷的文字特效。 9_3.htm 阴影文字的特殊效果。 9_4.htm 彩色文字的特殊效果。 9_5.htm 升降文字的特殊效果。 9_6.htm 打字效果的文字特效。 9_7.htm 淡入淡出的文字效果。 9_8.htm 炽热文字的特殊效果。 第10章(\10) 示例描述:页面的链接地址个性化。 10_1.htm 按时消失的链接。 10_2.htm 带滚动提示的链接。 10_3.htm 动态变换的链接。 10_4.htm 滚动链接。 10_5.htm 不断闪动的链接。 10_6.htm 在按钮上显示不同的链接。 10_7.htm 带链接的滚动字幕。 第11章(\11) 示例描述:在HTMLJavaScript控制图像页面。 11_1.htm 不停闪烁的图片。 11_2.htm 图片展示选项。 11_3.htm 图片的渐显播放。 11_4.htm 将图片固定在页面左上角。 11_5.htm 左右移动的图片。 11_6.htm 图像滚动公告版。 11_7.
目录 IBM WEBSPHERE PORTAL 1 目录 2 参数资料 10 一、搜索功能 11 1、搜索表单 11 2、搜索组件 11 3、搜索集合 12 4、站点设置 13 5、模板 13 6、站区创建及内容 13 7、搜索跳转页面 14 8、搜索表单的部署 14 9、详细内容页面 14 10、其他组件 14 11、搜索功能会遇到的问题及其解决方案 14 12、搜索过滤 16 13、注意 16 14、WCM高级搜索参数 16 ADVANCED WCM/WEBSPHERE PORTAL SEARCH INTEGRATION 17 Introduction 17 How to search WCM content using this metadata 18 Specific example 21 15、高级参数二 32 16、搜索网页资料 33 二、页面导航 41 1、页面导航组件创建 41 2、使用场景及其环境设置 41 三、授权与用户 41 1、一般用户 41 2、匿名用户 42 3、授权地点及其方式 42 4、传播与继承 42 5、用户与组管理 43 四、域名 44 1、portal服务器域名 44 2、本机域名映射 44 五、WCM几个页面路径及其名称 44 1、登录页面 44 2、主题及主页页面 45 3、皮肤外观页面路径 45 4、session超时页面 45 5、登录portal时,绕过登录界面,直接进入到主页(或再登录) 45 6、自定义登录跳转页面 45 7、判断用户是否登录标签 46 8、portal登录注销再登录只出现一张图片 46 9、登录失败及修改提示信息 46 10、设置超时跳转页面 47 11、 输出登录用户名称 47 12、输出注销 48 13 、动态链接 48 六、使用WCM时,会遇到的问题 48 1、不能向富文本编辑器粘贴内容 48 2、设置WCM timeout超时值 48 3、一般用户不能访问内容 49 4、页面导航不能分页 49 5、一些portal常见问题 49 6、Portal调用PUMA SPI管理用户和组信息 51 7、WCM内存溢出的解决方法 53 七、组件及其标签 53 (一)、标签 53 1、jsp组件 53 2、组件关联格式 54 3、IDCmpnt标签 55 4、workflowcmpnt标签 55 5、securitycmpnt标签 58 6、profilecmpnt 标签 63 7、pathcmpnt 标签 65 8、historycmpnt标签 67 9、idcmpnt标签 70 10、数字显示格式 73 11、URLCmpnt标签 74 12、AptrixLibCmpnt 标签 76 13、placeholder标签与用户名显示 77 14、JSP初始化workspace的标签 78 15、JSP标签输出一条内容 78 (二)、标签及其功能的使用 78 1、Writing links to Web Content Management content 78 (三)拖放 JSP标记 80 1) 80 2) 83 3) 84 (四)拖放区域 84 1)在定制主题和外表使用拖放 85 2)拖放标记摘要 85 3)拖放 API 86 八、功能应用或问题 87 1、WCM多子站区指向指定子站区配置 87 2、更改PORTAL默认的登录选项 89 3、如何在主题与皮肤获取PORTAL登录用户信息 90 4、PORTAL6.1.0.3无法查找任何的用户或用户组 92 5、如何个性化PORTLET添加控制板 93 6、IBM WCM匿名搜索 94 7、开发一个系统登录的PORTLET 95 8、WEBSPHERE PORTAL调整PORTLET之间的间隙 102 9、PORTAL6.1.0.1配置扩展属性 105 10、内容链接(同服务器或同站区) 120 11、内容链接(不同服务器或不同站区) 120 12、草稿内容阶段的判断、操作和获取(API) 121 13、WCM 附件下载 121 14、WCM流程带审核组成 122 15、关于使用WCM API获取内容的小经验 123 16、PORTAL WAR包部署方式 124 17、设置PAGE-AREA区域背景为透明 127 18、设置PAGE-AREA区域的宽度 127 19、设置左侧导航页面相对标签的缩进 128 20、PORTLET之间间隙的调整 129 21、WCM 主题获取登录用户的UID信息 129 22、配置是否自动加载主题JSP文件 131 23、菜单标题链接迭代方式(

87,907

社区成员

发帖
与我相关
我的任务
社区描述
Web 开发 JavaScript
社区管理员
  • JavaScript
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧