跪求一正则,有难度哦~

xuxubaby 2012-04-26 10:12:50
获取页面中包含指定的指定链接,比如 <a title="标题" href="http://www.xxxx.com" target="_blank">标题</a>

要获取网页中所有的这个链接,其中超链接的 title 属性可有可无,target 属性也是可有可无,但是必须包含 www.xxxx.com

...全文
130 15 打赏 收藏 转发到动态 举报
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复
q107770540 2012-04-26
  • 打赏
  • 举报
回复
string existsReg=@"(?i)<a\b[^>]*?href=(['""]?)(https?://)?[^\.]+\.xxxx\.com\1[^>]*?>[^<>]*</a>";
xuxubaby 2012-04-26
  • 打赏
  • 举报
回复
区分大小写吧 ?
xuxubaby 2012-04-26
  • 打赏
  • 举报
回复
还是不行。。
q107770540 2012-04-26
  • 打赏
  • 举报
回复
[Quote=引用 10 楼 的回复:]

[/Quote]

我擦,您这是C#呢,还以为你是javascript
修改一下:

string existsReg=@"<a\b[^>]*?href=(['""]?)(https?://)?[^\.]+\.xxxx\.com\1[^>]*?>[^<>]*</a>/";
xuxubaby 2012-04-26
  • 打赏
  • 举报
回复
谁能加下我的qq啊,可能是我表达的不清晰吧。 1411613687
xuxubaby 2012-04-26
  • 打赏
  • 举报
回复
xuxubaby 2012-04-26
  • 打赏
  • 举报
回复
[Quote=引用 6 楼 的回复:]
JScript code
var url = "http://www\.xxxx\.com";
var regex = "<a[^>]*? href=(\"|')?"+ url +"\\1[^>]*>[^<]*<\\/a>"
var oRegex = new RegExp(regex,"ig");
var html = "你的html";
var result;
while(resul……
[/Quote]

不行。。
q107770540 2012-04-26
  • 打赏
  • 举报
回复
/<a\b[^>]*?href=(['\"]?)(https?:\/\/)?[^.]+\.xxxx\.com\1[^>]*?>[^<>]*<\/a>/gi
q107770540 2012-04-26
  • 打赏
  • 举报
回复
[Quote=引用楼主 的回复:]
获取页面中包含指定的指定链接,比如 <a title="标题" href="http://www.xxxx.com" target="_blank">标题</a>

要获取网页中所有的这个链接,其中超链接的 title 属性可有可无,target 属性也是可有可无,但是必须包含 www.xxxx.com
[/Quote]
/<a\b[^>]*?href=(['\"]?)(https?://)?[^.]+\.xxxx\.com\1[^>]*?>[^<>]*</a>/gi
挨踢直男 2012-04-26
  • 打赏
  • 举报
回复
var url = "http://www\.xxxx\.com";
var regex = "<a[^>]*? href=(\"|')?"+ url +"\\1[^>]*>[^<]*<\\/a>"
var oRegex = new RegExp(regex,"ig");
var html = "你的html";
var result;
while(result = oRegex.exec(html))
{
document.write(result[0]+"<br/>");
}
xuxubaby 2012-04-26
  • 打赏
  • 举报
回复
前面带有二级域名的也要查出来
xuxubaby 2012-04-26
  • 打赏
  • 举报
回复
前面的 http:// 可有可无, 链接的样式也有可能是 beijing.xxxx.com 这样的
001007009 2012-04-26
  • 打赏
  • 举报
回复

var s = '<a title="标题" href="http://www.xxxx.com" target="_blank">标题</a><a href="http://www.xxxx.com">标题123</a>'
var re = /<a.+?www\.xxxx\.com.+?>[^<]+?<\/a>/g;
alert(s.match(re))


没问题的
xuxubaby 2012-04-26
  • 打赏
  • 举报
回复
不行啊
001007009 2012-04-26
  • 打赏
  • 举报
回复
/<a.+?www\.xxxx\.com.+?>[^<]+?<\/a>/g

试试

61,112

社区成员

发帖
与我相关
我的任务
社区描述
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
社区管理员
  • HTML(CSS)社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧