19,620
社区成员




zgs@yssett:~>cut -c 1-2 aaa
你好
12
ab
zgs@yssett:~>echo $LANG
zh_CN.GB2312
zgs@yssett:~>LANG=C
zgs@yssett:~>cut -c 1-2 aaa
你
12
ab
>file aaa
aaa: ISO-8859 text
我在两台机器上都做过cut测试,一个可以通过设置LANG来达到汉字占两位,一个始终把汉字当一位,两个环境file aaa 都是ISO-8859 text。两个环境如下:uname -a
Linux yssett 2.6.16.60-0.54.5-bigsmp #1 SMP Fri Sep 4 01:28:03 UTC 2009 i686 i686 i386 GNU/Linux
此环境可以通过设置LANG使汉字占两位
uname -a
Linux linux 2.6.16.60-0.85.1-bigsmp #1 SMP Thu Mar 17 11:45:06 UTC 2011 i686 i686 i386 GNU/Linux
此环境汉字始终占一位,也就是cut -c 1-2 aaa始终都取到了两个汉字file aaa