页面中的utf-8编码如何转换为中文

newstarao 2010-07-01 04:45:27
我用GetHttpConnection下载下来的页面里的中文用utf-8编码处理了比如“跳”转换为了“跳”。
这个页面可以自动做转换
http://tool.chinaz.com/Tools/UTF-8.aspx

我想知道如何用vc实现转换,mfc里是否有对应的函数
注意我得到的跳是字符串。。。
最好是能提供源码 不用太详细只要关键部分就可以,当然如果能提示下思路也行,问题解决后结贴,先谢谢了
...全文
401 10 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
stonewater 2010-07-03
  • 打赏
  • 举报
回复
来晚了,顶下
newstarao 2010-07-03
  • 打赏
  • 举报
回复
谁能告诉我为什么不能结贴。。。给完分,点击完直接退出登录变成游客。。。郁闷试了那次了。。我用的ie7
newstarao 2010-07-02
  • 打赏
  • 举报
回复
CString ok="8df3";
int b=_tcstoul(ok,NULL,16);
wchar_t aa = b;
CString temp(aa);

问题解决了,我的方法是,得到utf-8编码的字符串后会存到cstring中,类似ok,然后用_tcstoul函数转换字符串的进制,然后整形数值转换为字符赋给Cstringtemp,输出。。。呵呵,各位见笑了。我是本着我的实际需要出发的,可能有地方不规范。总之输出的内容正确了。大家的答案在一定程度上误导了我。。。欢迎大家批评指正。
ps:我的是多字符字符集,vs2005
hzy694358 2010-07-01
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 jennyvenus 的回复:]

使用WideCharToMultiByte和MultiByteToWideChar组合,先转换成utf16,再转成gb。
[/Quote]
基本原理就这样,
网上有很多例子
cclk-1024 2010-07-01
  • 打赏
  • 举报
回复
"跳"这样的字符串我感觉要先拆开,
分成
char a[3] = {0x8d,0xf3,0x00};
MessageBox(NULL,a,NULL,NULL);
然后可能需要unicode和asc的转换,楼上已经说了
iamshuke 2010-07-01
  • 打赏
  • 举报
回复
十六进制字符串转数值的问题,可以参考这个: http://blog.csdn.net/zhaoyawei/archive/2006/04/29/696694.aspx
iamshuke 2010-07-01
  • 打赏
  • 举报
回复
需要先解析"跳"这样的字符串,把其中的十六进制数字转成一个一个的WORD(WCHAR),放入数组中,再用楼上几位的方法去转。
用户 昵称 2010-07-01
  • 打赏
  • 举报
回复
使用WideCharToMultiByte和MultiByteToWideChar组合,先转换成utf16,再转成gb。
踏实每一步 2010-07-01
  • 打赏
  • 举报
回复
int UTF8ToGB(const char* str,char *out)
{
WCHAR *strSrc;
TCHAR *szRes;
int len;

//获得临时变量的大小
int i = MultiByteToWideChar(CP_UTF8, 0, str, -1, NULL, 0);
strSrc = new WCHAR[i+1];
MultiByteToWideChar(CP_UTF8, 0, str, -1, strSrc, i);

//获得临时变量的大小
i = WideCharToMultiByte(CP_ACP, 0, strSrc, -1, NULL, 0, NULL, NULL);
szRes = new TCHAR[i+1];
WideCharToMultiByte(CP_ACP, 0, strSrc, -1, szRes, i, NULL, NULL);

len = (i+1)*sizeof(CHAR);
memcpy(out,szRes,len);
out[len+1] ='\0';

delete []strSrc;
delete []szRes;

return len;
}


C/C++ code
//GB2312字符串转为UTF-8编码
LPCTSTR GB2312ToUTF8(LPTSTR pUTF8Out,LPCTSTR pGB2312Input, int GB2312Len)
{
CHAR buf[4];
LPCTSTR lpReturn,pGB2312Cursor,pGB2312InputEnd;
WCHAR wcBuffer;

lpReturn = (LPCTSTR)pUTF8Out;
pGB2312Cursor = (LPTSTR)pGB2312Input;
pGB2312InputEnd= pGB2312Cursor + GB2312Len;

while( pGB2312Cursor<pGB2312InputEnd ){
//如果ANSII直接复制就可以
if( *pGB2312Cursor>0 ){
*pUTF8Out++ = *pGB2312Cursor++;
}else{
::MultiByteToWideChar(CP_ACP,MB_PRECOMPOSED,pGB2312Cursor,2,&wcBuffer,1);
memcpy( pUTF8Out, UnicodeToUTF8Char(buf,wcBuffer), 3 );
pGB2312Cursor += 2;
pUTF8Out += 3;
}
}
*pUTF8Out = '\0';
return lpReturn;
}
muzizongheng 2010-07-01
  • 打赏
  • 举报
回复
具体看你的工程设置, 如果你的工程师Unicode, 你得到string时就应该把这个字符串转成UTF-16; 用MultiCharToWideChar。

如果你的工程是多字节的, 就把它转成CP_ACP。
本下载包与书籍的实战篇紧密结合. 下载包的程序是一个简明的示例论坛程序,按照循序渐进的原则,分为不同的步骤: 步骤1: 建立最简单的项目基础结构:Board/User/Article三个类,包含最基本的配置文件。同时,在这一步,建立测试类,刻画项目各个类之间的契约关系。 步骤2: 对文章的种类增加“投票”类型,展示对多型的处理。 步骤3: 增加webwork实现的GUI。 加入支持。 步骤4: 升级到Hibernate 3。 环境说明 --------- 程序包的程序经过测试的运行环境为: 1, Tomcat 5.0.25 2, Hibernate 2.1.7 3, Hibernate 3.0.2 4, Eclipse 3.0.1 (作为IDE) 5, ant 1.6(作为build工具) 6, java sdk 1.4.2 7, mysql 4.1 (作为后台数据库) 8, 至少250M硬盘空间(hibernate 2,3和webwork就将占据138M) 虽然在更高版本应该可以不加修改的运行,但我们对此不加以保证。(v1.2将对Hibernate 3.0.4进行测试) 安装说明 --------- 1, 确认jdk 1.4.2已经正确安装; 2,将本程序包解压,假设目录为: x:\rs\hib-samples 3, 从hibernate的sf下载区下载2.1.7与3.0.2版本: http://sourceforge.net/project/showfiles.php?group_id=40712 4,将下载的hibernate包解压到x:\rs\hib-samples\hibernate-2.1与x:\rs\hib-samples\hibernate-3,目录结构应该为: x: + rs + hib-samples <--- 本文件包解压的目录 + forum-step1-db-first-middlegen + forum-step1-db-first-synchronizer + forum-step2 + ... + hibernate-2.1 <--- Hibernate 2.1.7解压到这里 + bin <--- 确认bin与doc目录就在解压后的hibernate-2.1目录 + doc + ... + hibernate-3.0 <--- Hibernate 3.0.2解压到这里 + bin preference -> Java -> Build Path -> User Librarys,分别建立名为Hibernate2,hibernate3,mysql-jdbc的用户库,分别包含对应的lib文件(如hibernate2包含hibernate-2.1目录下的hibernate2.jar及其lib目录下的所有jar文件); 11, 在您的eclipse ,导入各个目录下的.project文件,以建立工程.(工程名为step1,step2,step3,step4)。在工程的类路径配置,使用上一步创建的用户库(step1-step3使用Hibernate2,step4使用hibernate3)。确保没有编译错误。 好了,您现在可以开始阅读代码,作一些自己的改变,看看您能得到什么结果 :) 处理说明 ------------ 关于的处理,是在step3加入的,因此在step1以及step2,请使用英文进行实验。具体进行的处理为全程采用UTF-8编码. 1,mysql创建时,字符集必须选择UTF-8 2,在mysql jdbc连接的url,必须指定采用utf-8 encoding。 jdbc:mysql://localhost/forum?useUnicode=true&characterEncoding=utf-8&mysqlEncoding=utf8 3,在jsp页面,指定页面采用UTF-8编码. 假若在您的项目,必须使用GBK编码,则在以上的各个地方,都需要把UTF-8更换为GBK方可正常使用。 版本更新 ----------- v1.2 (PLAN,TBD) * 转换到JTA * 给出一个脱离DAO模式的例子 * 给出for hibernate 3的xdoclet例子 v1.1 (2005.5.25) * 分离db目录下的build.xml * 增加了对投票的图形显示 * 修正了和webwork相关的一个bug v1.0 (2005.4.20) * 初始版本

16,548

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • AIGC Browser
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧