如何用正则将html文件内的标记中Src的内容提取出来?

siugwan 2005-04-26 11:17:20
也就是html里有很多图片标记,如何提取所有图片的路径和文件名?
...全文
340 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
Heister 2005-04-26
  • 打赏
  • 举报
回复
<img.*src\s*=\s*"?(.+?)["?|\s*|>]
速马 2005-04-26
  • 打赏
  • 举报
回复
try:

string html = @"<img src=""123.gif""></img><img src=""234.gif""></img>";
string regex = @"<img.*?src\s*=\s*(""|')?(?<src>.*?)(""|')?(\s|>)";
MatchCollection mc = Regex.Matches(html,regex,RegexOptions.IgnoreCase | RegexOptions.Singleline);
foreach(Match m in mc)
{
Console.WriteLine(m.Groups["src"]);
}
rachy 2005-04-26
  • 打赏
  • 举报
回复
换成绝对路径也很简单啊
string uri="http://现在的路径"
Uri baseUri = new Uri(uri);
myUri = new Uri(baseUri,相对路径)
rachy 2005-04-26
  • 打赏
  • 举报
回复
string patn = @"/[^=]*?(\.html|\.asp|\.jsp|\.aspx|\.php)";
MatchCollection matchs = Regex.Matches(content,patn,RegexOptions.IgnoreCase|RegexOptions.Multiline);

换成.gif试看看
top1000 2005-04-26
  • 打赏
  • 举报
回复
你可以去下载个正则表达式的自动的生成工具
要不就自己好好研究下
还可以去网站自己查查了
这样问,很少人能回答你的
Heister 2005-04-26
  • 打赏
  • 举报
回复
提取应该还是简单的,提取以后 还要 根据 相对路径来转换到绝对路径
_-_-_-_- 2005-04-26
  • 打赏
  • 举报
回复
不懂..up

110,572

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧