急!高分!java编译的在window下取汉字拼音首字母正常,但在unix下为什么为乱码,该如何解决!等待高手分析。。。。。

yao_yao_ 2006-03-26 10:27:05
本人根据网友提供的算法(该算法附下:)
功能:录入汉字,提交后,显示中文拼音首字母
实例:“中国”-》“zg”
环境:原来用jbuilder在windows-xp环境下编译执行,显示正常,但是由于服务器是英文版unix(编码方式应该为:iso-8859-1),录入汉字(“中国”)提交后页面显示是乱码(不是“zg”).
请高手们多多指点,项目进行中,因此很急!!!帮忙~!~!~
不知道是不是要改动一下算法还是在什么地方作修改~

汉字转拼音的算法如下:
private static int compare(String str1, String str2) {
int result = 0;
String m_s1 = null;
String m_s2 = null;
try {
m_s1 = new String(str1.getBytes(_FromEncode_), _ToEncode_);
m_s2 = new String(str2.getBytes(_FromEncode_), _ToEncode_);
} catch (Exception e) {
return str1.compareTo(str2);
}
result = chineseCompareTo(m_s1, m_s2);
return result;
}

/**
* 被getBeginCharacter方法调用
* @param s String
* @return value
*/

private static int getCharCode(String s) {
if (s == null && s.equals("")) {
return -1;
}
byte b[] = s.getBytes();
int value = 0;
for (int i = 0; i < b.length && i <= 2; i++) {
value = value * 100 + b[i];
}

return value;
}

/**
* 被getBeginCharacter方法调用
* @param s1 String
* @param s2 String
* @return int len1 - len2
*/


public static int chineseCompareTo(String s1, String s2) {
int len1 = s1.length();
int len2 = s2.length();
int n = Math.min(len1, len2);
for (int i = 0; i < n; i++) {
int s1_code = getCharCode(s1.charAt(i) + "");
int s2_code = getCharCode(s2.charAt(i) + "");
if (s1_code * s2_code < 0) {
return Math.min(s1_code, s2_code);
}
if (s1_code != s2_code) {
return s1_code - s2_code;
}
}

return len1 - len2;
}

/**
* 将中文名称转化为拼音首字母的简称
* @param String res 中文名称
* @return String result 拼音首字母的简称
*/
public static String getBeginCharacter(String res) {
String a = res;
String result = "";
for (int i = 0; i < a.length(); i++) {
String current = a.substring(i, i + 1);
if (compare(current, "\u554A") < 0) {
result = result + current;
} else
if (compare(current, "\u554A") >= 0 &&
compare(current, "\u5EA7") <= 0) {
if (compare(current, "\u531D") >= 0) {
result = result + "z";
} else
if (compare(current, "\u538B") >= 0) {
result = result + "y";
} else
if (compare(current, "\u6614") >= 0) {
result = result + "x";
} else
if (compare(current, "\u6316") >= 0) {
result = result + "w";
} else
if (compare(current, "\u584C") >= 0) {
result = result + "t";
} else
if (compare(current, "\u6492") >= 0) {
result = result + "s";
} else
if (compare(current, "\u7136") >= 0) {
result = result + "r";
} else
if (compare(current, "\u671F") >= 0) {
result = result + "q";
} else
if (compare(current, "\u556A") >= 0) {
result = result + "p";
} else
if (compare(current, "\u54E6") >= 0) {
result = result + "o";
} else
if (compare(current, "\u62FF") >= 0) {
result = result + "n";
} else
if (compare(current, "\u5988") >= 0) {
result = result + "m";
} else
if (compare(current, "\u5783") >= 0) {
result = result + "l";
} else
if (compare(current, "\u5580") >= 0) {
result = result + "k";
} else
if (compare(current, "\u51FB") > 0) {
result = result + "j";
} else
if (compare(current, "\u54C8") >= 0) {
result = result + "h";
} else
if (compare(current, "\u5676") >= 0) {
result = result + "g";
} else
if (compare(current, "\u53D1") >= 0) {
result = result + "f";
} else
if (compare(current, "\u86FE") >= 0) {
result = result + "e";
} else
if (compare(current, "\u642D") >= 0) {
result = result + "d";
} else
if (compare(current, "\u64E6") >= 0) {
result = result + "c";
} else
if (compare(current, "\u82AD") >= 0) {
result = result + "b";
} else
if (compare(current, "\u554A") >= 0) {
result = result + "a";
}
}
}

return result;
}



private static String _FromEncode_ = "GBK";
private static String _ToEncode_ = "GBK";

----------------------------------
我调试时写了个主函数输出,如下:
public static void main(String[] args) {
String str = null;
str = "中国人";
System.out.println("Spell=" + StringUtils.getBeginCharacter(str));
}
windows下面能狗正常显示出"zgr" ,unix下为什么不行呢,如何解决?!
...全文
222 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
yao_yao_ 2006-03-26
  • 打赏
  • 举报
回复
好的,非常感谢,终于有人肯帮忙了!再次感谢,有消息答复我哟!
wizardblue 2006-03-26
  • 打赏
  • 举报
回复
可能是转码的时候发生问题了,呆会我去aix上试试
yao_yao_ 2006-03-26
  • 打赏
  • 举报
回复
to:ibiswang(神鸟)
你意思是先转换成unicode编码,然后再执行StringUtils.getBeginCharacter(str)就应该可以是吗??!
yao_yao_ 2006-03-26
  • 打赏
  • 举报
回复
wizardblue(不死鱼) :有没有结果呀?回个话!!!
yao_yao_ 2006-03-26
  • 打赏
  • 举报
回复
to TinyJimmy:
执行程序使用
java -Dfile.encoding=GBK ...方式执行,

如果再unix下编译,还需要使用
javac -encoding GBK ...


这两句不明白是什么意思?能解释一下吗?!
我试了一下,问题如下:

C:\test>java StringUtils.encoding=GBK
Exception in thread "main" java.lang.NoClassDefFoundError: StringUtils/encoding=
GBK
TinyJimmy 2006-03-26
  • 打赏
  • 举报
回复
执行程序使用
java -Dfile.encoding=GBK ...方式执行,

如果再unix下编译,还需要使用
javac -encoding GBK ...

ibiswang 2006-03-26
  • 打赏
  • 举报
回复
I think the problem is he os's default character encoding.

I think you can change your test program as following:

public static void main(String[] args) {
String str = null;
str = "\uxxxx\uxxxx\uxxxxx"; // this string should be the unicode value
// of "中国人"
System.out.println("Spell=" + StringUtils.getBeginCharacter(str));
}


81,095

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧