有什么办法解析一串文字的比特流

yurilin 2011-07-09 08:32:26

BYTE content[10]
0 15 230 136 145 230 152 175 228 184

一共5个字。
看上去是2个字节一个字，共10个字节

如何把他们解析成文字呢。

不一定是汉字，可能包含特殊文字，数字英文韩文日文什么的

这一串只是汉字

原文是我是一只猪

...全文

141 12 打赏收藏转发到动态举报

写回复

用AI写文章

12 条回复

切换为时间正序

请发表友善的回复…

发表回复

用户　昵称 2011-07-10

打赏
举报

#include "stdafx.h"

#include "windows.h"



int main(int argc, char* argv[])

{

	unsigned char utf8[ 0x10 ] = { 230, 136, 145, 230, 152, 175, };

	

	unsigned short e[ 0x10 ];



	char ansi[ 0x100 ] = "";



	MultiByteToWideChar( CP_UTF8, 0, ( char * )utf8, 6, e, 10 );



	WideCharToMultiByte( CP_ACP, 0, e, 2, ansi, 10, NULL, NULL );



	printf( "%s\r\n", ansi );



	return 0;

}

yurilin 2011-07-10

打赏
举报

还是搞不定类。
就是想把比特流转换成一个可以字符串

MultiByteToWideChar (CP_ACP, 0, ansi, xx, uni, xx );
这步得到了一个uni数组，不过还是看不懂

用户　昵称 2011-07-10

打赏
举报

char ansi[ 0x20 ] = "字符串"
char utf8[ 0x40 ];
wchar uni[ 0x20 ];

MultiByteToWideChar (CP_ACP, 0, ansi, xx, uni, xx );
WideCharToMultiByte (CP_UTF8, 0, uni, xx, utf8, xx );

用户　昵称 2011-07-10

打赏
举报

wchar a[0x10] = L"字符串";
MultiByteToWideChar (CP_UTF8, 0, a, -1, (LPWSTR)content, 10 );

yurilin 2011-07-10

打赏
举报

BYTE content[256];

content赋值

LPCSTR sText=0;
MultiByteToWideChar (CP_ACP, 0, sText, -1, (LPWSTR)content, 10 );

结果sText获得一个错误指针。
是数据不对还是写的不对。

(LPWSTR)content可以这样强转么

用户　昵称 2011-07-10

打赏
举报

//utf8_string ( "我是一只猪" )
//--utf8_string convert utf16-little-endian format input data to utf8 format
//-- input = 11 62 2F 66 00 4E EA 53 2A 73
//-- output = E6 88 91 E6 98 AF E4 B8 80 E5 8F AA E7 8C AA
//
//-----Final result --- 0xE6, 0x88, 0x91, 0xE6, 0x98, 0xAF, 0xE4, 0xB8, 0x80, 0xE5, 0x8F, 0xAA, 0xE7, 0x8C, 0xAA,
//

yurilin 2011-07-10

打赏
举报

ls还真厉害唉。

请问怎么用程序解析出这几个字。能给点提示么。。。
发送方是用的utf8，但是未必c++的utf8

yurilin 2011-07-10

打赏
举报

ok.大致解析出来了。多谢了

yurilin 2011-07-10

打赏
举报

多谢了。
但是{ 230, 136, 145, 230, 152, 175, };
只有三个字
如果要更长这里的参数怎么改啊
unsigned char utf8[ 0x10 ]为什么定16个字节
unsigned short e[ 0x10 ];为什么定16个字节
char ansi[ 0x100 ] = "";为什么定256个字节

MultiByteToWideChar( CP_UTF8, 0, ( char * )utf8, 6, e, 10 );
这里的6和10是怎么定的啊

WideCharToMultiByte( CP_ACP, 0, e, 2, ansi, 10, NULL, NULL );
这里的2和10有是什么讲究

比如
{ 230, 136, 145, 230, 152, 175, 230, 136, 145};
怎么改解析出个我是我来

呵呵，麻烦了

用户　昵称 2011-07-09

打赏
举报

230 136 145 我
230 152 175 是
其他的不全

用户　昵称 2011-07-09

打赏
举报

230 152 175 表示 utf8格式的 “是”

用户　昵称 2011-07-09

打赏
举报

楼主是玩弄我等的？

本文详解哈夫曼编码原理及在C++中的高效实现，涵盖哈夫曼树构建、前缀编码生成、变长比特流处理、频率统计与树序列化，并讨论其在DEFLATE等实际压缩算法中的协同作用。重点突出算法核心——基于字符频次的最优前缀码构造、最小堆驱动的贪心建树、内存安全的节点管理，以及面向二进制数据的泛化支持。

本文介绍Perl编程进阶内容，包括原型用途、方法与函数等价性、自动解引用、绑定等特性，还提及实用核心模块，如strict、warnings等编译指令。同时给出CPAN模块选择建议，列举数据库、文本、图像处理等应用案例，最后总结要点并给出学习建议。

本文系统讲解信源编码的核心原理及香农编码、范诺编码、哈夫曼编码三大经典变长编码算法。涵盖唯一可译码与Kraft不等式理论基础，详述各算法的编码步骤、平均码长计算、效率对比与最优性验证，并结合工程场景分析适用条件：哈夫曼编码保障最优压缩率，范诺编码兼顾效率与实现简易性，香农编码作为理论基准。强调其在无损压缩（ZIP/GZIP/JPEG）中的关键技术地位。

本文深入解析Java中字符串编码转换的方法，包括如何解决乱码问题，通过实例演示不同编码间的转换过程，如UTF-8、GBK、ISO-8859-1等。

本文详细解析了字符集的概念及乱码产生的原因，并通过实例演示如何在Java中解决HTTP请求中的乱码问题。

VC/MFC

16,551

社区成员

421,606

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

VC/MFC社区版块或许是CSDN最“古老”的版块了，记忆之中，与CSDN的年龄几乎差不多。随着时间的推移，MFC技术渐渐的偏离了开发主流，若干年之后的今天，当我们面对着微软的这个经典之笔，内心充满着敬意，那些曾经的记忆，可以说代表着二十年前曾经的辉煌……
向经典致敬，或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天，我们期待着MFC技术能够恢复其曾经的辉煌，或许这个期待会永远成为一种“梦想”，或许一切皆有可能……
我们希望这个版块可以很好的适配Web时代，期待更好的互联网技术能够使得MFC技术框架得以重现活力，……

试试用AI创作助手写篇文章吧

+ 用AI写文章