关于汉字编码到Unicode（UCS2）的转换

wiserfirst 2004-10-10 06:53:20

我需要实现在linux平台下由汉字编码转换为UCS2字符集编码，希望有高手可以给以指点，十分感谢！

...全文

567 1 打赏收藏转发到动态举报

写回复

用AI写文章

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

柯本 2004-10-10

打赏
举报

Windows环境下，用C实现UCS2编码和解码的算法如下：

// UCS2编码
// pSrc: 源字符串指针
// pDst: 目标编码串指针
// nSrcLength: 源字符串长度
// 返回: 目标编码串长度
int gsmEncodeUcs2(const char* pSrc, unsigned char* pDst, int nSrcLength)
{
int nDstLength; // UNICODE宽字符数目
WCHAR wchar[128]; // UNICODE串缓冲区

// 字符串-->UNICODE串
nDstLength = ::MultiByteToWideChar(CP_ACP, 0, pSrc, nSrcLength, wchar, 128);

// 高低字节对调，输出
for(int i=0; i<nDstLength; i++)
{
// 先输出高位字节
*pDst++ = wchar[i] >> 8;
// 后输出低位字节
*pDst++ = wchar[i] & 0xff;
}

// 返回目标编码串长度
return nDstLength * 2;
}

// UCS2解码
// pSrc: 源编码串指针
// pDst: 目标字符串指针
// nSrcLength: 源编码串长度
// 返回: 目标字符串长度
int gsmDecodeUcs2(const unsigned char* pSrc, char* pDst, int nSrcLength)
{
int nDstLength; // UNICODE宽字符数目
WCHAR wchar[128]; // UNICODE串缓冲区

// 高低字节对调，拼成UNICODE
for(int i=0; i<nSrcLength/2; i++)
{
// 先高位字节
wchar[i] = *pSrc++ << 8;

// 后低位字节
wchar[i] |= *pSrc++;
}

// UNICODE串-->字符串
nDstLength = ::WideCharToMultiByte(CP_ACP, 0, wchar, nSrcLength/2, pDst, 160, NULL, NULL);

// 输出字符串加个结束符
pDst[nDstLength] = '\0';

// 返回目标字符串长度
return nDstLength;
}

在linux下,主要要实现WideCharToMultiByte/MultiByteToWideChar
这里是我回答过的:
http://community.csdn.net/Expert/topic/3326/3326599.xml?temp=.9262964