用户账号名称等字符处理问题(特殊符号,标点,繁体字等)
账号受理进程,需要对用户的输入进行合理性过滤,首先出现的问题就是前端提供的utf-8编码的字串,如何去判断字串中是否包含特殊的符号,标点等, 顺带一些屏蔽了的字符是不能出现在命名中的,这些字串如何处理,在繁体字的情况下。这个东西缠了很久,单纯的utf-8转到gb2312的话, 在英文系统下回出问题,然后在港澳台地区繁体字的情况下需要如何处理这个问题,正则表达式感觉应该是可以搞定的,但是正则该以一个什么规则来弄呢。c++下正则尝试过各种情况,都没有成功过。。。