急！高分！java编译的在window下取汉字拼音首字母正常，但在unix下为什么为乱码，该如何解决！等待高手分析。。。。。

yao_yao_ 2006-03-26 10:27:05

本人根据网友提供的算法（该算法附下：）
功能：录入汉字，提交后，显示中文拼音首字母
实例：“中国”－》“zg”
环境：原来用jbuilder在windows-xp环境下编译执行，显示正常，但是由于服务器是英文版unix(编码方式应该为：iso-8859-1)，录入汉字（“中国”）提交后页面显示是乱码（不是“zg”）.
请高手们多多指点，项目进行中，因此很急！！！帮忙～！～！～
不知道是不是要改动一下算法还是在什么地方作修改～

汉字转拼音的算法如下：
private static int compare(String str1, String str2) {
int result = 0;
String m_s1 = null;
String m_s2 = null;
try {
m_s1 = new String(str1.getBytes(_FromEncode_), _ToEncode_);
m_s2 = new String(str2.getBytes(_FromEncode_), _ToEncode_);
} catch (Exception e) {
return str1.compareTo(str2);
}
result = chineseCompareTo(m_s1, m_s2);
return result;
}

/**
* 被getBeginCharacter方法调用
* @param s String
* @return value
*/

private static int getCharCode(String s) {
if (s == null && s.equals("")) {
return -1;
}
byte b[] = s.getBytes();
int value = 0;
for (int i = 0; i < b.length && i <= 2; i++) {
value = value * 100 + b[i];
}

return value;
}

/**
* 被getBeginCharacter方法调用
* @param s1 String
* @param s2 String
* @return int len1 - len2
*/

public static int chineseCompareTo(String s1, String s2) {
int len1 = s1.length();
int len2 = s2.length();
int n = Math.min(len1, len2);
for (int i = 0; i < n; i++) {
int s1_code = getCharCode(s1.charAt(i) + "");
int s2_code = getCharCode(s2.charAt(i) + "");
if (s1_code * s2_code < 0) {
return Math.min(s1_code, s2_code);
}
if (s1_code != s2_code) {
return s1_code - s2_code;
}
}

return len1 - len2;
}

/**
* 将中文名称转化为拼音首字母的简称
* @param String res 中文名称
* @return String result 拼音首字母的简称
*/
public static String getBeginCharacter(String res) {
String a = res;
String result = "";
for (int i = 0; i < a.length(); i++) {
String current = a.substring(i, i + 1);
if (compare(current, "\u554A") < 0) {
result = result + current;
} else
if (compare(current, "\u554A") >= 0 &&
compare(current, "\u5EA7") <= 0) {
if (compare(current, "\u531D") >= 0) {
result = result + "z";
} else
if (compare(current, "\u538B") >= 0) {
result = result + "y";
} else
if (compare(current, "\u6614") >= 0) {
result = result + "x";
} else
if (compare(current, "\u6316") >= 0) {
result = result + "w";
} else
if (compare(current, "\u584C") >= 0) {
result = result + "t";
} else
if (compare(current, "\u6492") >= 0) {
result = result + "s";
} else
if (compare(current, "\u7136") >= 0) {
result = result + "r";
} else
if (compare(current, "\u671F") >= 0) {
result = result + "q";
} else
if (compare(current, "\u556A") >= 0) {
result = result + "p";
} else
if (compare(current, "\u54E6") >= 0) {
result = result + "o";
} else
if (compare(current, "\u62FF") >= 0) {
result = result + "n";
} else
if (compare(current, "\u5988") >= 0) {
result = result + "m";
} else
if (compare(current, "\u5783") >= 0) {
result = result + "l";
} else
if (compare(current, "\u5580") >= 0) {
result = result + "k";
} else
if (compare(current, "\u51FB") > 0) {
result = result + "j";
} else
if (compare(current, "\u54C8") >= 0) {
result = result + "h";
} else
if (compare(current, "\u5676") >= 0) {
result = result + "g";
} else
if (compare(current, "\u53D1") >= 0) {
result = result + "f";
} else
if (compare(current, "\u86FE") >= 0) {
result = result + "e";
} else
if (compare(current, "\u642D") >= 0) {
result = result + "d";
} else
if (compare(current, "\u64E6") >= 0) {
result = result + "c";
} else
if (compare(current, "\u82AD") >= 0) {
result = result + "b";
} else
if (compare(current, "\u554A") >= 0) {
result = result + "a";
}
}
}

return result;
}

private static String _FromEncode_ = "GBK";
private static String _ToEncode_ = "GBK";

－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－
我调试时写了个主函数输出，如下：
public static void main(String[] args) {
String str = null;
str = "中国人";
System.out.println("Spell=" + StringUtils.getBeginCharacter(str));
}
windows下面能狗正常显示出"zgr" ,unix下为什么不行呢，如何解决？！

...全文

222 7 打赏收藏转发到动态举报

写回复

用AI写文章

7 条回复

切换为时间正序

请发表友善的回复…

发表回复

yao_yao_ 2006-03-26

打赏
举报

好的，非常感谢，终于有人肯帮忙了！再次感谢，有消息答复我哟！

wizardblue 2006-03-26

打赏
举报

可能是转码的时候发生问题了,呆会我去aix上试试

yao_yao_ 2006-03-26

打赏
举报

to:ibiswang(神鸟)
你意思是先转换成unicode编码，然后再执行StringUtils.getBeginCharacter（str）就应该可以是吗？？！

yao_yao_ 2006-03-26

打赏
举报

wizardblue(不死鱼) ：有没有结果呀？回个话！！！

yao_yao_ 2006-03-26

打赏
举报

to TinyJimmy:
执行程序使用
java -Dfile.encoding=GBK ...方式执行，

如果再unix下编译，还需要使用
javac -encoding GBK ...

这两句不明白是什么意思？能解释一下吗？！
我试了一下，问题如下：

C:\test>java StringUtils.encoding=GBK
Exception in thread "main" java.lang.NoClassDefFoundError: StringUtils/encoding=
GBK

TinyJimmy 2006-03-26

打赏
举报

执行程序使用
java -Dfile.encoding=GBK ...方式执行，

如果再unix下编译，还需要使用
javac -encoding GBK ...

ibiswang 2006-03-26

打赏
举报

I think the problem is he os's default character encoding.

I think you can change your test program as following:

public static void main(String[] args) {
String str = null;
str = "\uxxxx\uxxxx\uxxxxx"; // this string should be the unicode value
// of "中国人"
System.out.println("Spell=" + StringUtils.getBeginCharacter(str));
}

Linux 170个常见问题的详细解答 ...比如我们想删除/temp目录下的文件却将命令不小心输成“rm / temp（在‘/’后多了一个空格）”，那么就极可能删去根目录下的所有文件。再者，“Linux是一个真正意义上的多任务、多...

默认QtCreator是单线程编译，可能设计之初考虑到尽量不过多占用系统资源，而现在的电脑都是多核心的，默认msvc编译器是多线程编译的不需要手动设置，而对于其他编译器，需要手动设置才行。方法一：在每个项目的...

http://blog.donews.com/lvjiyong/archive/2006/06/29/931071.aspx怎样将后台生成的在内存中的图象显示到客户端Microsoft IE WebControls下载地址如何在DATAGRID中使用JAVASCRIPT脚本控制DataGrid中连接到下一页显示...

比如我们想删除/temp目录下的文件却将命令不小心输成“rm / temp（在‘/’后多了一个空格）”，那么就极可能删去根目录下的所有文件。再者，“Linux是一个真正意义上的多任务、多用户系统”，不体会一下Linux的特色...