社区
工具平台和程序库
帖子详情
关于汉字编码到Unicode(UCS2)的转换
wiserfirst
2004-10-10 06:53:20
我需要实现在linux平台下由汉字编码转换为UCS2字符集编码,希望有高手可以给以指点,十分感谢!
...全文
567
1
打赏
收藏
关于汉字编码到Unicode(UCS2)的转换
我需要实现在linux平台下由汉字编码转换为UCS2字符集编码,希望有高手可以给以指点,十分感谢!
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
柯本
2004-10-10
打赏
举报
回复
Windows环境下,用C实现UCS2编码和解码的算法如下:
// UCS2编码
// pSrc: 源字符串指针
// pDst: 目标编码串指针
// nSrcLength: 源字符串长度
// 返回: 目标编码串长度
int gsmEncodeUcs2(const char* pSrc, unsigned char* pDst, int nSrcLength)
{
int nDstLength; // UNICODE宽字符数目
WCHAR wchar[128]; // UNICODE串缓冲区
// 字符串-->UNICODE串
nDstLength = ::MultiByteToWideChar(CP_ACP, 0, pSrc, nSrcLength, wchar, 128);
// 高低字节对调,输出
for(int i=0; i<nDstLength; i++)
{
// 先输出高位字节
*pDst++ = wchar[i] >> 8;
// 后输出低位字节
*pDst++ = wchar[i] & 0xff;
}
// 返回目标编码串长度
return nDstLength * 2;
}
// UCS2解码
// pSrc: 源编码串指针
// pDst: 目标字符串指针
// nSrcLength: 源编码串长度
// 返回: 目标字符串长度
int gsmDecodeUcs2(const unsigned char* pSrc, char* pDst, int nSrcLength)
{
int nDstLength; // UNICODE宽字符数目
WCHAR wchar[128]; // UNICODE串缓冲区
// 高低字节对调,拼成UNICODE
for(int i=0; i<nSrcLength/2; i++)
{
// 先高位字节
wchar[i] = *pSrc++ << 8;
// 后低位字节
wchar[i] |= *pSrc++;
}
// UNICODE串-->字符串
nDstLength = ::WideCharToMultiByte(CP_ACP, 0, wchar, nSrcLength/2, pDst, 160, NULL, NULL);
// 输出字符串加个结束符
pDst[nDstLength] = '\0';
// 返回目标字符串长度
return nDstLength;
}
在linux下,主要要实现WideCharToMultiByte/MultiByteToWideChar
这里是我回答过的:
http://community.csdn.net/Expert/topic/3326/3326599.xml?temp=.9262964
UCS2
-汉字互相
转换
综上所述,"
UCS2
-汉字互相
转换
"项目涉及的主要技术点包括VB中的
Unicode
字符串处理、字符编码
转换
、文件读写以及错误处理。在开发过程中,理解
Unicode
和
UCS2
编码的原理,熟悉VB提供的相关API,以及如何处理编码
转换
中...
GB2312,UTF8,
UCS2
汉字编码
生成与
转换
工具
"GB2312, UTF8,
UCS2
汉字编码
生成与
转换
工具"就是这样一个实用工具,它能够帮助用户方便地进行编码间的
转换
,确保信息在各种系统间准确无误地传递。 对于"release"这个文件,它可能是该工具的发行版本,可能包含了...
ASCII码及
UCS2
编码
转换
器,包含中文编解码
例如,要将ASCII字符串
转换
为
UCS2
,可以使用`Encoding.ASCII.GetBytes`方法获取ASCII编码的字节数组,然后用`Encoding.BigEndian
Unicode
.GetString`将这个字节数组
转换
为
UCS2
字符串。相反,将
UCS2
转换
为ASCII,需要...
ucs2
和GB
转换
表
UCS(Universal Character Set)和GBK、GB2312都是
汉字编码
标准,它们各自有着不同的特点和适用范围。本文将详细解析这些编码格式及其
转换
关系。 首先,UCS,全称为统一字符集,是一个广泛使用的字符编码系统,包括...
汉字
Unicode
互换工具
对于汉字,
Unicode
通常采用UCS-2或UCS-4编码方案,其中UCS-2使用两个字节(16位)表示一个汉字,UCS-4则使用四个字节(32位)。由于大部分汉字在UCS-2范围内,因此在日常应用中,UCS-2编码更为常见。 在描述中提到...
工具平台和程序库
24,857
社区成员
27,330
社区内容
发帖
与我相关
我的任务
工具平台和程序库
C/C++ 工具平台和程序库
复制链接
扫一扫
分享
社区描述
C/C++ 工具平台和程序库
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章