62,615
社区成员
发帖
与我相关
我的任务
分享
Document doc = Jsoup.parseBodyFragment(htmltext); // or Jsoup.parse(...);
Elements images = doc.select("img");
for(Element image : images){
System.out.printf("%s:%s%n", image.attr("src"), image.attr("alt"));
}
package com.walkman.regex;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 获取字符串里的所有的img标签 img标签可能是大写的IMG也可能是小写的img,并输出相应img标签的src和alt
* 作者:Tank
* 日期:2011-12-24
* 文件名:GetImagSrc.java
*/
public class GetImagSrc {
public static void main(String[] args) {
String s = "<img src='12345' alt='demo_alt'>small_tank</img>" +
"<IMG src='大写' alt='upper_letter'>BIG_TANK</IMG>" +
"<img src='test_again' alt='中文也测试_alt'>坦克</img>";
new GetImagSrc().getImgSrc(s);
}
public void getImgSrc(String s) {
// 防止字符串参数出错
int length = s.length();
if (length <= 0) {
System.out.println("字符串长度为零或者字符串为空");
return;
} else {
// 首先匹配img标签内的内容
String img_regex = "<(?i)img(.*?)>(.*?)</(?i)img>";
Pattern p = Pattern.compile(img_regex);
Matcher m = p.matcher(s);
String src_alt;
String img_name;
while(m.find()){
src_alt=m.group(1);
img_name=m.group(2);
if(null==src_alt && null==img_name){
continue;
}
System.out.println("SRC的内容是:" + src_alt);
System.out.println("IMAGE名称是: " + img_name);
// 匹配src中的内容
String src_reg = "src=\'(.*?)\'";
Pattern src_p = Pattern.compile(src_reg);
Matcher src_m = src_p.matcher(src_alt);
while(src_m.find()){
System.out.println("src是:" + src_m.group(1));
}
// 匹配alt中的内容
String alt_reg = "alt=\'(.*?)\'";
Pattern alt_p = Pattern.compile(alt_reg);
Matcher alt_m = alt_p.matcher(src_alt);
while(alt_m.find()){
System.out.println("alt是:" + alt_m.group(1));
}
System.out.println("\n" + "*******************华丽的分隔线*************************" + "\n");
}
}
}
}