如何用正则表达式描述一个不在一对小括号中的逗号?

rover11 2013-10-23 01:15:10

需求是按逗号","来分割字符串,但这个逗号不能包含在一对括号中,比如
"(aa,bb) adf , asdfa,afd()"
应该返回
(aa,bb) adf
asdfa
afd()
这样
请教该如何写?

...全文

342 8 打赏收藏转发到动态举报

写回复

8 条回复

切换为时间正序

请发表友善的回复…

发表回复

花木兰1闪21A 2013-10-24

打赏
举报

回复

引用 7 楼 yaojunyi3721 的回复:

开始匹配括号内的正则我写成这样(?<=\(.*),(?=.*\)) 结果把三个逗号都匹配到了因为这个字符串最后是以“）”结尾的这个断言匹配到了字符串最后那个“）” 于是改成(?<=\(.*),(?=[^(]*\))让零宽正向先行断言的表达式内不允许出现“（”于是断言只会匹配到“bb)” 貌似是贪婪的问题但是不能使用“？”终止贪婪模式这样写(?=.*?\))是不对的

取括号中的内容这样不行嘛 regex="\\((.+?)\\)"

yaojunyi3721 2013-10-23

打赏
举报

回复

开始匹配括号内的正则我写成这样(?<=\(.*),(?=.*\)) 结果把三个逗号都匹配到了因为这个字符串最后是以“）”结尾的这个断言匹配到了字符串最后那个“）” 于是改成(?<=\(.*),(?=[^(]*\))让零宽正向先行断言的表达式内不允许出现“（”于是断言只会匹配到“bb)” 貌似是贪婪的问题但是不能使用“？”终止贪婪模式这样写(?=.*?\))是不对的

花木兰1闪21A 2013-10-23

打赏
举报

回复

给你个思路，先用正则将所有（）中的内容用list存起来，然后就将字符串的相应的内容用A,B,C等等先代替，然后split(","),然后再把A,B,C用list中的对应的换过来

rover11 2013-10-23

打赏
举报

回复

好吧,自己写个土办法,先告一段落吧 String input= "(aa,bb) adf , asdfa,afd()"; List<Integer> l = new ArrayList<Integer>(); int foundCount = 0; byte []arrInput = input.getBytes(); for(int i=0;i<arrInput.length;i++){ if(arrInput[i] == '('){ foundCount++; } if(arrInput[i]==',' && foundCount>0){ l.add(i); } if(arrInput[i]==')'){ foundCount--; } } for(int index : l){ arrInput[index] = '#'; } String res = new String(arrInput); String []cols = res.split(",");

yaojunyi3721 2013-10-23

打赏
举报

回复

可以有这个思路先用正则匹配到括号内的逗号然后修改成任意不常见字符串比如!@#，然后用,split分组，再遍历数组每一项如果string.contains("!@#")就replace成，关键就是第一步怎么找到括号内的， (?<=\(.*),(?=[^(]*\))可以匹配到这个逗号具体代码： string ss = "(aa,bb) adf , asdfa,afd()"; string newstr = Regex.Replace(ss, @"(?<=\(.*),(?=[^(]*\))", "!@#"); string[] list= newstr.Split(new char[]{','}, StringSplitOptions.RemoveEmptyEntries); List<string> temp = new List<string>(); foreach (var item in list) { temp.Add(item.Replace("!@#", ",")); } string result = string.Join(",",temp);

rover11 2013-10-23

打赏
举报

回复

哦,一回事,是不是无法判断是否成对出现的?

rover11 2013-10-23

打赏
举报

回复

换一下,找出所有包含在一对括号里的逗号可行么?

suciver 2013-10-23

打赏
举报

回复

这个在java中的正则做不到,因为java的正则不支持平衡组

正则表达式教程
　正则表达式(regular expression)描述了一种字符串匹配的模式，可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。

列目录时，　dir *.txt或ls *.txt中的*.txt就不是一个正则表达式,因为这里*与正则式的*的含义是不同的。
　　正则表达式是由普通字符（例如字符 a 到 z）以及特殊字符（称为元字符）组成的文字模式。正则表达式作为一个模板，将某个字符模式与所搜索的字符串进行匹配。

3.1 普通字符
　　由所有那些未显式指定为元字符的打印和非打印字符组成。这包括所有的大写和小写字母字符，所有数字，所有标点符号以及一些符号。

3.2 非打印字符字符含义
\cx 匹配由x指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 'c' 字符。
\f 匹配一个换页符。等价于 \x0c 和 \cL。
\n 匹配一个换行符。等价于 \x0a 和 \cJ。
\r 匹配一个回车符。等价于 \x0d 和 \cM。
\s 匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\t 匹配一个制表符。等价于 \x09 和 \cI。
\v 匹配一个垂直制表符。等价于 \x0b 和 \cK。

3.3 特殊字符

　　所谓特殊字符，就是一些有特殊含义的字符，如上面说的"*.txt"中的*，简单的说就是表示任何字符串的意思。如果要查找文件名中有＊的文件，则需要对＊进行转义，即在其前加一个\。ls \*.txt。正则表达式有以下特殊字符。

　

特别字符说明
$ 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性，则 $ 也匹配 '\n' 或 '\r'。要匹配 $ 字符本身，请使用 \$。
( ) 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符，请使用 \( 和 \)。
* 匹配前面的子表达式零次或多次。要匹配 * 字符，请使用 \*。
+ 匹配前面的子表达式一次或多次。要匹配 + 字符，请使用 \+。
. 匹配除换行符 \n之外的任何单字符。要匹配 .，请使用 \。
[ 标记一个中括号表达式的开始。要匹配 [，请使用 \[。
? 匹配前面的子表达式零次或一次，或指明一个非贪婪限定符。要匹配 ? 字符，请使用 \?。
\ 将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如， 'n' 匹配字符 'n'。'\n' 匹配换行符。序列 '\\' 匹配 "\"，而 '\(' 则匹配 "("。
^ 匹配输入字符串的开始位置，除非在方括号表达式中使用，此时它表示不接受该字符集合。要匹配 ^ 字符本身，请使用 \^。
{ 标记限定符表达式的开始。要匹配 {，请使用 \{。
| 指明两项之间的一个选择。要匹配 |，请使用 \|。

　　构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与操作符将小的表达式结合在一起来创建更大的表达式。正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。
　

3.4 限定符

　　限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。有*或+或?或{n}或{n,}或{n,m}共6种。
*、+和?限定符都是贪婪的，因为它们会尽可能多的匹配文字，只有在它们的后面加上一个?就可以实现非贪婪或最小匹配。
　　 正则表达式的限定符有：
　

字符描述
* 匹配前面的子表达式零次或多次。例如，zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。
+ 匹配前面的子表达式一次或多次。例如，'zo+' 能匹配 "zo" 以及 "zoo"，但不能匹配 "z"。+ 等价于 {1,}。
? 匹配前面的子表达式零次或一次。例如，"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等价于 {0,1}。
{n} n 是一个非负整数。匹配确定的 n 次。例如，'o{2}' 不能匹配 "Bob" 中的 'o'，但是能匹配 "food" 中的两个 o。
{n,} n 是一个非负整数。至少匹配n 次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。
{n,m} m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。例如，"o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。

3.5 定位符

　　用来描述字符串或单词的边界，^和$分别指字符串的开始与结束，\b描述单词的前或后边界，\B表示非单词边界。不能对定位符使用限定符。

3.6 选择

　　用圆括号将所有选择项括起来，相邻的选择项之间用|分隔。但用圆括号会有一个副作用，是相关的匹配会被缓存，此时可用?:放在第一个选项前来消除这种副作用。
　　其中?:是非捕获元之一，还有两个非捕获元是?=和?!，这两个还有更多的含义，前者为正向预查，在任何开始匹配圆括号内的正则表达式模式的位置来匹配搜索字符串，后者为负向预查，在任何开始不匹配该正则表达式模式的位置来匹配搜索字符串。

3.7 后向引用

　　对一个正则表达式模式或部分模式两边添加圆括号将导致相关匹配存储到一个临时缓冲区中，所捕获的每个子匹配都按照在正则表达式模式中从左至右所遇到的内容存储。存储子匹配的缓冲区编号从 1 开始，连续编号直至最大 99 个子表达式。每个缓冲区都可以使用 '\n' 访问，其中 n 为一个标识特定缓冲区的一位或两位十进制数。
　　可以使用非捕获元字符 '?:', '?=', or '?!' 来忽略对相关匹配的保存。

保罗，复活这个问题，因为它有一个简单的解决方案，这是不提及。 (在为regex bounty quest做一些研究时发现了你的问题。)此外，现有解决方案检查逗号后面没有括号，但不能保证它嵌入括号中。的正则表达式是非常简单的：\(.*?\)|(,)交替的左侧完整的括号匹配。我们将忽略这些匹配。右侧与第1组匹配并捕获逗号，并且我们知道它们是正确的逗号，因为它们与左侧的表达式不匹配。在此demo中，您可...

通过上面几个简单的示例，可以了解到常见的基础正则表达式的元字符主要包括以下几个^ 匹配输入字符串的开始位置。除非在方括号表达式中使用，表示不包含该字符集合。要匹配”^”字符本身，请使用"\^"$ 匹配输入字符串的结尾位置。如果设置了RegExp对象的 Multiline属性，则"$”也匹配'\n'或'\r’,。要匹配”$"字符本身，请使用”\$". 匹配除"\r\n"之外的任何单个字符\ 反斜杠，又叫转义字符，去除其后紧跟的元字符或通配符的特殊意义* 匹配前面的子表达式零次或多次。...

小括号是分组、中括号是内容、大括号是次数。

目录引言第一章 正则表达式字符匹配攻略 1 两种模糊匹配 2. 字符组 3. 量词 4. 多选分支 5. 案例分析第1章小结第二章 正则表达式位置匹配攻略 1. 什么是位置呢？ 2. 如何匹配位置呢？ 3. 位置的特性 4. 相关案例第二章小结第三章 正则表达式括号的作用 1. 分组和分支结构 2. 引用分组 3. 反向引用 4. 非捕获分组 ...

62,614

社区成员

307,326

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章