有什么办法解析一串文字的比特流

yurilin 2011-07-09 08:32:26
BYTE content[10]
0 15 230 136 145 230 152 175 228 184

一共5个字。
看上去是2个字节一个字,共10个字节


如何把他们解析成文字呢。

不一定是汉字,可能包含特殊文字,数字 英文 韩文 日文 什么的

这一串只是汉字


原文是 我是一只猪
...全文
103 12 打赏 收藏 转发到动态 举报
写回复
用AI写文章
12 条回复
切换为时间正序
请发表友善的回复…
发表回复
用户 昵称 2011-07-10
  • 打赏
  • 举报
回复
#include "stdafx.h"
#include "windows.h"

int main(int argc, char* argv[])
{
unsigned char utf8[ 0x10 ] = { 230, 136, 145, 230, 152, 175, };

unsigned short e[ 0x10 ];

char ansi[ 0x100 ] = "";

MultiByteToWideChar( CP_UTF8, 0, ( char * )utf8, 6, e, 10 );

WideCharToMultiByte( CP_ACP, 0, e, 2, ansi, 10, NULL, NULL );

printf( "%s\r\n", ansi );

return 0;
}
yurilin 2011-07-10
  • 打赏
  • 举报
回复
还是搞不定类。
就是想把比特流转换成一个可以字符串


MultiByteToWideChar (CP_ACP, 0, ansi, xx, uni, xx );
这步得到了一个uni数组,不过还是看不懂

用户 昵称 2011-07-10
  • 打赏
  • 举报
回复
char ansi[ 0x20 ] = "字符串"
char utf8[ 0x40 ];
wchar uni[ 0x20 ];

MultiByteToWideChar (CP_ACP, 0, ansi, xx, uni, xx );
WideCharToMultiByte (CP_UTF8, 0, uni, xx, utf8, xx );

用户 昵称 2011-07-10
  • 打赏
  • 举报
回复
wchar a[0x10] = L"字符串";
MultiByteToWideChar (CP_UTF8, 0, a, -1, (LPWSTR)content, 10 );
yurilin 2011-07-10
  • 打赏
  • 举报
回复
BYTE content[256];

content赋值

LPCSTR sText=0;
MultiByteToWideChar (CP_ACP, 0, sText, -1, (LPWSTR)content, 10 );


结果sText获得一个错误指针。
是数据不对还是写的不对。

(LPWSTR)content可以这样强转么
用户 昵称 2011-07-10
  • 打赏
  • 举报
回复

//
utf8_string ( "我是一只猪" )
//--
utf8_string convert utf16-little-endian format input data to utf8 format
//--
input = 11 62 2F 66 00 4E EA 53 2A 73
//--
output = E6 88 91 E6 98 AF E4 B8 80 E5 8F AA E7 8C AA
//

//-----
Final result --- 0xE6, 0x88, 0x91, 0xE6, 0x98, 0xAF, 0xE4, 0xB8, 0x80, 0xE5, 0x8F, 0xAA, 0xE7, 0x8C, 0xAA,
//
yurilin 2011-07-10
  • 打赏
  • 举报
回复
ls还真厉害唉。

请问怎么用程序解析出这几个字。能给点提示么。。。
发送方是用的utf8,但是未必c++的utf8
yurilin 2011-07-10
  • 打赏
  • 举报
回复
ok.大致解析出来了。多谢了
yurilin 2011-07-10
  • 打赏
  • 举报
回复
多谢了。
但是{ 230, 136, 145, 230, 152, 175, };
只有三个字
如果要更长这里的参数怎么改啊
unsigned char utf8[ 0x10 ]为什么定16个字节
unsigned short e[ 0x10 ];为什么定16个字节
char ansi[ 0x100 ] = "";为什么定256个字节

MultiByteToWideChar( CP_UTF8, 0, ( char * )utf8, 6, e, 10 );
这里的6和10是怎么定的啊

WideCharToMultiByte( CP_ACP, 0, e, 2, ansi, 10, NULL, NULL );
这里的2和10有是什么讲究



比如
{ 230, 136, 145, 230, 152, 175, 230, 136, 145};
怎么改解析出个 我是我 来


呵呵,麻烦了




用户 昵称 2011-07-09
  • 打赏
  • 举报
回复
230 136 145 我
230 152 175 是
其他的不全
用户 昵称 2011-07-09
  • 打赏
  • 举报
回复
230 152 175 表示 utf8格式的 “是”
用户 昵称 2011-07-09
  • 打赏
  • 举报
回复
楼主是玩弄我等的?

16,472

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • Web++
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧