急急急!了解或用过正则表达式的看过来,求指教

a11212007310 java web开发  2015-09-11 03:29:46
鄙人想用正则模糊匹配word文档中部分内容,我想要获取【编制单位~人民币】这段范围内中的“xxxxxx表”,我写的表达式有:"编.*司[\\n\\r]*(.*表).*日[\\n\\r]*(单.*币)",但是只匹配到下面内容的第二个,其他都没匹配到,求指教!公司名和表名就用xxx来代替了。
下面是读取的word内容在控制台的显示:
1、
编制单位: aaaaaaaa公司

aaaaaaa表 2014 年 12 月 31 日




单位:元币种:人民币
2、
编制单位:bbbbbbbbbb公司
bbbbbbbb表 2014 年 12 月 31 日



单位:元币种:人民币
3、
cccccccc表 2014 年 1—12 月


单位:元币种:人民币
4、
ddddddddd表 2014 年 1—12 月


单位:元币种:人民币
...全文
89 点赞 收藏 3
写回复
3 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
a11212007310 2015-09-14
引用 2 楼 rui888 的回复:
自己在改改。
	String s="1、\r\n编制单位: aaaaaaaa公司\r\naaaaaaa表 2014 年 12 月 31 日\r\n单位:元币种:人民币\r\n2、\r\n编制单位:bbbbbbbbbb公司\r\nbbbbbbbb表 2014 年 12 月 31 日\r\n单位:元币种:人民币 ".replaceAll("\\r\\n", "~");
       System.err.println(s);
		Matcher m=Pattern.compile("编制单位.*?~(.*?表).").matcher(s);
        while(m.find())
            System.out.println(m.group(1));
你这个规则不好匹配。
谢谢你的回复,不过你给的建议不是我所需要的,不过还是谢谢你了。分都给你了,我的问题已经解决了。
回复
兔子托尼啊 2015-09-11
自己在改改。
	String s="1、\r\n编制单位: aaaaaaaa公司\r\naaaaaaa表 2014 年 12 月 31 日\r\n单位:元币种:人民币\r\n2、\r\n编制单位:bbbbbbbbbb公司\r\nbbbbbbbb表 2014 年 12 月 31 日\r\n单位:元币种:人民币 ".replaceAll("\\r\\n", "~");
       System.err.println(s);
		Matcher m=Pattern.compile("编制单位.*?~(.*?表).").matcher(s);
        while(m.find())
            System.out.println(m.group(1));
你这个规则不好匹配。
回复
兔子托尼啊 2015-09-11
你把换行替换成个固定的不就好了。
回复
相关推荐
发帖
Web 开发
创建于2007-09-28

8.0w+

社区成员

Java Web 开发
申请成为版主
帖子事件
创建了帖子
2015-09-11 03:29
社区公告
暂无公告