utf-8解码的问题？在线等！！！

talkingmute 2007-01-23 05:15:19

急求utf-8解码的代码？
将如下一组十六进制数，还原成中文....
e8 bf 99 e6 98 af e6 88 91 e7 9a 84 e6 96 b9 e6 a1 88

...全文

560 13 打赏收藏转发到动态举报

写回复

用AI写文章

13 条回复

切换为时间正序

请发表友善的回复…

发表回复

halve 2007-01-31

打赏
举报

python裏頭很簡單
>>> print unicode('\xe8\xbf\x99\xe6\x98\xaf\xe6\x88\x91\xe7\x9a\x84\xe6\x96\xb9\
xe6\xa1\x88', 'utf-8')
... 这是我的方案

muymuy 2007-01-29

打赏
举报

补充一下：
利用libiconv先将这个utf-8表示的字符串，转换为gbk编码的字符串，然后，打印此字符串就可以显示出汉字。

muymuy 2007-01-29

打赏
举报

这属于字符集编码转换的问题，标准C/C++的函数库里没有这个功能。只能借助第三方库，libiconv是一个很好的选择，linux默认就安装了这个库，开源的，而且跨平台，windows也可以用，需要自己编译一下。

参考：
http://www.gnu.org/software/libiconv/

htqx 2007-01-29

打赏
举报

那要一个编码规律,可能还要一个编码表之类的东西.

只要将uft-8转化为uft-16,就可以用wprintf 这类w开头的字符串函数来处理了.

muymuy 2007-01-29

打赏
举报

补充一句：
大名顶顶的xerces-c（一个处理xml的开发包），为了支持多国语言就是采用wchar_t，wstring，并采用utf-16编码。

iambic 2007-01-29

打赏
举报

typedef wchar_t* String;

String ReadStringAt(FILE* fp, String buffer, size_t buffer_length, size_t utflen)
{
int c, char2, char3;
int count = 0;
unsigned int i;

assert(buffer_length > utflen );
if (buffer_length <= utflen)
{
fprintf(stderr, "too short buffer");
exit(1);
}

for (i = 0; i < utflen; ++i)
{
c = (fgetc(fp)) & 0xFF;
if (c==-1)
{
fprintf(stderr, "EOFException\n");
exit(1);
}
switch (c>>4)
{
case 0: case 1: case 2: case 3: case 4: case 5: case 6: case 7:
/* 0xxxxxxx*/
count++;
*buffer++ = c;
break;
case 12: case 13:
/* 110x xxxx 10xx xxxx*/
count += 2;
char2 = fgetc(fp);
if (char2==-1)
{
fprintf(stderr, "EOFException\n");
exit(1);
}
if ((char2 & 0xC0) != 0x80)
{
fprintf(stderr, "malformed input around byte %s\n", count);
exit(1);
}
*buffer++ = ((c&0x1F)<<6) | (char2&0x3F);
break;
case 14:
/* 1110 xxxx 10xx xxxx 10xx xxxx */
count += 3;
char2 = fgetc(fp);
char3 = fgetc(fp);
if ( char2==-1 || char3==-1 )
{
fprintf(stderr, "EOFException\n");
exit(1);
}
if ( (char2 & 0xC0) != 0x80 || (char3 & 0xC0) != 0x80 )
{
fprintf(stderr, "malformed input around byte %s\n", count -1 );
exit(1);
}
*buffer++ = ((c&0x0F)<<12) | ((char2&0x3F)<<6) | (char3&0x3F);
break;
default:
/* 10xx xxxx, 1111 xxxx */
fprintf(stderr, "malformed input around byte %s\n", count);
exit(1);
}
}
*buffer++ = 0;
return buffer;
}

muymuy 2007-01-29