一个c++处理中文标点的问题
我要在一个中英文混杂的语句中标记出所有的标点符号,用的是string::find(sign)函数,但是碰到了如下问题:
输入: 董建华昨天下午在政府总部与传媒见面时,谈及港府的新财政预算案和公务员体制改革,也第一次就梁锦松买新车风波发表谈话。
输出:
at 0
at 2
, at 40
, at 80
。 at 116
《 at 3
这里在董建华之前是有两个空格,但是程序把第二个空格的第二个字节和“董
”的第一个字节看作了《,这个显然是不对的,我应该如何得到正确的结果。
我的环境:redhat 7.3
kdevelop 2.1