求问一个分割方法. -- 把特定字符之间的字符剥离出来.

sasgsc 2013-07-18 09:33:58
条件:
<img src=\"\"><img src=\"\">
分离后想得到的结果:
String[] sArray={"jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAOijjEUYRScD1ooooA//Z\","jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAOijjEUYRScD1ooooA//Z\"};

求思路, 源码, 或者高效方法.
...全文
178 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
失落夏天 2013-07-19
  • 打赏
  • 举报
回复
首先楼主的代码是换行的 所以使用正则时必须添加忽视换行的不爱护(?s)。 楼主这活我以前经常干,从人家网站抓图片下载到本地。。

String btnstr="<img src=\"\">";
		Pattern p=Pattern.compile("(?s)img src=\"data:image/(jpeg.*?)\"");//这里最后一个\不会截取,因为输入字符串中其实本身就没有"\"
		Matcher m=p.matcher(btnstr);
		while(m.find()){
			System.out.println(m.group(1));
		}
  • 打赏
  • 举报
回复
引用 4 楼 oh_Maxy 的回复:
正则真是个神奇的东西,总是会把俺绕晕。。
同感,我现在只会最简单的,复杂的感觉脑细胞不够用。。。
oh_Maxy 2013-07-18
  • 打赏
  • 举报
回复
正则真是个神奇的东西,总是会把俺绕晕。。
Inhibitory 2013-07-18
  • 打赏
  • 举报
回复
注意正则里有贪婪与非贪婪模式: +与+?
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Hello {
    public static void main(String[] args) throws Exception {
        String str =
                "<img src=\\\"\\\"><img src=\\\"\\\">"
        ;

        String patternString = "<img src=\\\\\"data:image/(.+?)\">";
        Pattern pattern = Pattern.compile(patternString);
        Matcher matcher = pattern.matcher(str);

        while (matcher.find()) {
            System.out.println(matcher.group(1));
        }
    }
}
输出
jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAOijjEUYRScD1ooooA//Z\
jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAOijjEUYRScD1ooooA//Z\
Inhibitory 2013-07-18
  • 打赏
  • 举报
回复
import java.util.LinkedList;
import java.util.List;

public class Hello {
    public static void main(String[] args) throws Exception {
        String[] strs = {
                "<img src=\\\"\\\">",
                "<img src=\\\"\\\">"
        };

        List<String> result = new LinkedList<String>();

        String pattern = "<img src=\\\\\"data:image/(.+)\">";
        for (int i = 0; i < strs.length; ++i) {
            result.add(strs[i].replaceAll(pattern, "$1"));
        }

        System.out.println(result);
    }
}
输出
[jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAOijjEUYRScD1ooooA//Z\, jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAOijjEUYRScD1ooooA//Z\]
sasgsc 2013-07-18
  • 打赏
  • 举报
回复
这里真是个神奇的地方, 我都憋了三天没干出来, 这会居然想到了..... 自己贴个解决办法
youtData="<img src=\"\"><img src=\"\">";
		
		String[] tmp=youtData.split("<img");
		
		List<String> l=new ArrayList<String>();
		
		Pattern pattern = Pattern.compile("src=\"data:(.*)\">");
		
		for(int i=0;i<tmp.length;i++)
		{
			Matcher matcher = pattern.matcher(tmp[i]);
			if(matcher.find())
			{
				System.out.println(matcher.group(1));
			}
		}
求更好的思路.
jfinal好用的插件正在开发,下载源码https://github.com/Dreampie/jfinal-dreampie,maven引入方式:http://search.maven.org/ 输入jfinal-dreampie搜索 cn.dreampie jfinal-dreampie 0.2.3 https://github.com/Dreampie?tab=repositories   分割成多个独立的插件进行优化,可以看我的博客拆分优化情况 http://my.oschina.net/wangrenhui1990/blog demo:(Angularjs前端 jfinal-dreampie插件) https://github.com/Dreampie/icedog 剥离框架前的源码https://github.com/Dreampie/dreampie https://github.com/Dreampie?tab=repositories 目录下有多款插件: cn.dreampie.jfinal-shiro     https://github.com/Dreampie/jfinal-shiro    支持注解和数据库配置的shiro插件 cn.dreampie.jfinal-shiro-freemarker   https://github.com/Dreampie/jfinal-shiro-freemarker    shiro插件实现的freemarker标签库 cn.dreampie.jfinal-web     https://github.com/Dreampie/jfinal-web   相关web插件,简洁model实现 cn.dreampie.jfinal-utils        https://github.com/Dreampie/jfinal-utils   部分jfinal工具 cn.dreampie.jfinal-tablebind        https://github.com/Dreampie/jfinal-tablebind   jfinal的table自动绑定插件,支持多数据源 cn.dreampie.jfinal-flyway      https://github.com/Dreampie/jfinal-flyway   数据库脚本升级插件,开发中升级应用时,使用脚本同步升级数据库或者回滚 cn.dreampie.jfinal-captcha      https://github.com/Dreampie/jfinal-captcha   基于jfinal render的超简单验证吗插件 cn.dreampie.jfinal-quartz       https://github.com/Dreampie/jfinal-quartz   基于jfinal 的quartz管理器 cn.dreampie.jfinal-sqlinxml      https://github.com/Dreampie/jfinal-sqlinxml   基于jfinal 的类似ibatis的sql语句管理方案 cn.dreampie.jfinal-lesscss       https://github.com/Dreampie/jfinal-lesscss   java实现的lesscsss实时编译插件,可以由于jfinal cn.dreampie.jfinal-coffeescript     https://github.com/Dreampie/jfinal-coffeescript   java实现的coffeescript实时编译插件,可以由于jfinal  cn.dreampie.jfinal-akka    https://github.com/Dreampie/jfinal-akka   java使用akka执行异步任务 cn.dreampie.jfinal-mailer       https://github.com/Dreampie/jfinal-mailer   使用akka发布邮件的jfinal插件 cn.dreampie.jfinal-slf4j     https://github.com/Dreampie/jfinal-slf4j   让jfinal使用slf4j的日志api 使用方法请移步:http://my.oschina.net/wangrenhui1990/blog 部分代码正在调试和开发中,欢迎大家使用 介绍-> jfinal-dreampie是一个基于jfinal的开源框架库,主要集成或调优功能如下(由于篇幅原因部分源码未贴出,可以到github下载源码): 1.缓存维护更细粒度  @CacheNameRemove(name = AppConstants.DEFAULT_CACHENAME) @Inherited @Retention(RetentionPolicy.RUNTIME) @Target({ElementType.TYPE, ElementType.METHOD}) public @interface CacheNameRemove {   String name();   String[] keys() default {}; } //根据key值来移除基于某个特定方法的缓存,而不是移除整个controller下的缓存 String controllerKey = ai.getControllerKey();     if (!ValidateUtils.me().isNullOrEmpty(removeCacheName)) {       String keyPrefix = null;       if (!ValidateUtils.me().isNullOrEmpty(removeCacheKeys)) {         for (String removeKey : removeCacheKeys) {           keyPrefix = controllerKey   SLASH   removeKey;           removeByCacheKey(removeCacheName, keyPrefix);         }       } else {         keyPrefix = controllerKey;         removeByCacheKey(removeCacheName, keyPrefix);       }     } 2.增加Slf4jLogger实现,然日志配置能基于任何Slf4j下的log实现,如logback public class Slf4jLogFactory implements ILoggerFactory 3.基础model实现,实现基础的常用的部分功能用于复用  public List findAll() {     return find(getSelectSql()   getExceptSelectSql());   }   public List findBy(String where, Object... paras) {     return find(getSelectSql()   getExceptSelectSql()   getWhere(where), paras);   }   public List findTopBy(int topNumber, String where, Object... paras) {     return paginate(1, topNumber, getSelectSql(), getExceptSelectSql()   getWhere(where), paras).getList();   }   public M findFirstBy(String where, Object... paras) {     return findFirst(getSelectSql()   getExceptSelectSql()   getWhere(where), paras);   }   public Page paginateAll(int pageNumber, int pageSize) {     return paginate(pageNumber, pageSize, getSelectSql(), getExceptSelectSql());   }   public Page paginateBy(int pageNumber, int pageSize, String where, Object... paras) {     return paginate(pageNumber, pageSize, getSelectSql(), getExceptSelectSql()   getWhere(where), paras);   }   public boolean updateAll(String set, Object... paras) {     return Db.update(getUpdateSql()   getSet(set), paras) > 0;   }   public boolean updateBy(String set, String where, Object... paras) {     return Db.update(getUpdateSql()   getSet(set)   getWhere(where), paras) > 0;   }   public boolean deleteAll() {     return Db.update(getDeleteSql()) > 0;   }   public boolean deleteBy(String where, Object... paras) {     return Db.update(getDeleteSql()   getWhere(where), paras) > 0;   }   public boolean dropAll() {     return Db.update(getDropSql()) > 0;   }   public boolean dropBy(String where, Object... paras) {     return Db.update(getDropSql()   getWhere(where), paras) > 0;   } 4.akka异步执行框架 public class AkkaPlugin implements IPlugin Akka.system().scheduler().scheduleOnce(Duration.create(1000, TimeUnit.MILLISECONDS),         new Runnable() {           @Override           public void run() {             //do Something           }         }, Akka.system().dispatcher()); 5.atmosphere  chat demo @ManagedService(path = "/im/{room: [a-zA-Z][a-zA-Z_0-9]*}") public class ChatRoom { } 6.coffeescript  compiler plugin,编译coffeescript代码,并监控文件改动重新编译 public class CoffeeScriptPlugin implements IPlugin { } 7.Flyway 数据库自动脚本升级 Plugin,用于自动生成或升级数据库,避免不断使用数据库工具修改数据导致的版本问题 public class FlywayPlugin implements IPlugin { } 8.lesscss compiler plugin,编译less代码,并监控文件改动重新编译 public class LessCssPlugin implements IPlugin { } 9.mailer 邮件发送plugin,使用akka异步发送邮件  Akka.system().scheduler().scheduleOnce(Duration.create(1000, TimeUnit.MILLISECONDS),         new Runnable() {           @Override           public void run() {             MailerConf mailerConf = MailerPlugin.mailerConf;             HtmlEmail htmlEmail = new HtmlEmail();             htmlEmail.setCharset(mailerConf.getCharset());             htmlEmail.setSocketTimeout(mailerConf.getTimeout());             htmlEmail.setCharset(mailerConf.getEncode());             htmlEmail.setHostName(mailerConf.getHost());             if (!ValidateUtils.me().isNullOrEmpty(mailerConf.getSslport()))               htmlEmail.setSslSmtpPort(mailerConf.getSslport());             if (!ValidateUtils.me().isNullOrEmpty(mailerConf.getPort()))               htmlEmail.setSmtpPort(Integer.parseInt(mailerConf.getPort()));             htmlEmail.setSSLOnConnect(mailerConf.isSsl());             htmlEmail.setStartTLSEnabled(mailerConf.isTls());             htmlEmail.setDebug(mailerConf.isDebug());             htmlEmail.setAuthenticator(new DefaultAuthenticator(mailerConf.getUser(), mailerConf.getPassword()));             try {               htmlEmail.setFrom(mailerConf.getFrom(), mailerConf.getName());               htmlEmail.setSubject(subject);               htmlEmail.addTo(recipients);               htmlEmail.setHtmlMsg(body);               // set the alternative message               htmlEmail.setTextMsg("Your email client does not support HTML messages");               if (!ValidateUtils.me().isNullOrEmpty(attachment))                 htmlEmail.attach(attachment);               htmlEmail.send();             } catch (EmailException e) {               e.printStackTrace();             }           }         }, Akka.system().dispatcher()); 10.自定义验证码,可以自定义使用字符或者数字,颜色和样式可以自调 public class PatchcaRender extends Render {   private static final String CODE_CHAR = "0123456789"; } 11.QuartzPlugin使用quartz执行定时任务,参照部分网络实例,简易实现 QuartzFactory.me().startJobOnce(TimeUtils.me().toString(DateTime.now()),  jobId, "stati", this.getClass().getSimpleName(), OrderDataJob.class, param); 12.shiro权限框架,基于数据库url配置过滤,验证码验证 //读取数据库权限只需实现该接口 public interface JdbcAuthzService {   public Map getJdbcAuthz(); } 13.shiro的freemarker标签库 <@shiro.hasPermission name="P_USER">                 
  • ${i18n.getText("admin.user")}
  •              14.xss过滤的StringEscapeUtils过滤器实现 public class AttackHandler extends Handler {   @Override   public void handle(String target, HttpServletRequest request, HttpServletResponse response, boolean[] isHandled) {     request = new HttpServletRequestWrapper(request);     nextHandler.handle(target, request, response, isHandled);   } } 15.json数据请求时,返回的error信息使用json字符串 public class JsonErrorRenderFactory implements IErrorRenderFactory {   public Render getRender(int errorCode, String view) {     if (ThreadLocalUtil.isJson())       return new JsonErrorRender(errorCode, view);     else       return new ErrorRender(errorCode, view);   } } 16.自动绑定多数据源的tablebind AutoMultiSourceTableBindPlugin tableBindDefault = new AutoMultiSourceTableBindPlugin(druidDefault, SimpleNameStyles.LOWER); //让default数据源排除shop目录下的model,因为该目录的model属于custom数据源 tableBindDefault.addExcludePaths("cn.dreampie.function.shop"); AutoMultiSourceTableBindPlugin tableBindCustom = new AutoMultiSourceTableBindPlugin(druidCustom, SimpleNameStyles.LOWER); //让custom只扫描shop目录,注意当使用includepaths是只会扫描配置的路径,如果没有使用includepaths会扫描全路径 tableBindCustom.addIncludePaths("cn.dreampie.function.shop"); 17.压缩请求数据的gzipFilter,可测试 <!--gzip compress filter--> gzipFilter cn.dreampie.common.web.filter.gzip.GZIPFilter gzipFilter /* REQUEST FORWARD INCLUDE ERROR <!--gzip compress filter--> 18.http缓存cacheFilter,和gzipFilter共同用于提高用户性能 <!-- cache filter--> cacheFilter cn.dreampie.common.web.filter.cache.CacheFilter cacheFilter /* REQUEST FORWARD INCLUDE ERROR <!--cache filter--> 标签:jfinal

    62,614

    社区成员

    发帖
    与我相关
    我的任务
    社区描述
    Java 2 Standard Edition
    社区管理员
    • Java SE
    加入社区
    • 近7日
    • 近30日
    • 至今
    社区公告
    暂无公告

    试试用AI创作助手写篇文章吧