社区
Java SE
帖子详情
有没有可能猜出一个byte数组的charset
nielinjie
2004-04-19 12:04:33
我有一个byte数组,里面是一些汉字和英文字母的混合。
我可不可能通过某种方法猜出这个byte数组是什么编码?utf-8?gb2312? iso-8859-1……。比如某些byte只可能在某种编码中出现……
...全文
74
11
打赏
收藏
有没有可能猜出一个byte数组的charset
我有一个byte数组,里面是一些汉字和英文字母的混合。 我可不可能通过某种方法猜出这个byte数组是什么编码?utf-8?gb2312? iso-8859-1……。比如某些byte只可能在某种编码中出现……
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
11 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
CoolAbu
2004-04-19
打赏
举报
回复
很有深度的问题。
单个字节估计没有办法判断,如果是一个字符,可以取它的编码到Unicode的字符编码表中去比较,看看属于哪个区,从而判定是什么编码。
littlegang
2004-04-19
打赏
举报
回复
网上有相关的猜测算法介绍
有专门做这方面的,根据概率分析来判断文字的编码方式
其实像IE中的编码方式有“自动选择”一项,有可能就利用了这样的方法
panpan221
2004-04-19
打赏
举报
回复
新手学习,友情UP
KevinListening
2004-04-19
打赏
举报
回复
用眼睛看么?太可怕了吧。
kkcncry
2004-04-19
打赏
举报
回复
可以啊~将字符串按任何一种方式解码看那种解放方式解出的字符串不是乱码不就得了~
KevinListening
2004-04-19
打赏
举报
回复
这个问题如果解决了,很有用的。关注。。。
made_in_
2004-04-19
打赏
举报
回复
根据统计来估算吧。
抽取一定区域的byte,然后计算概率。
或者是和已知的编码方式相比较,看某些特定字符出现的概率是否接近。
至于真要实现的话,肯定还有许多细节问题要考虑。
zcjl
2004-04-19
打赏
举报
回复
gz
BigBangBug
2004-04-19
打赏
举报
回复
学习
filippo1980
2004-04-19
打赏
举报
回复
关注一下
tiger_wkh52741
2004-04-19
打赏
举报
回复
mark!!!!!!!!!!!!!!!!!!!!
C#引用c++DLL结构体
数组
注意事项
C#引用c++DLL结构体
数组
注意事项
当‘EFBFBD’和它的朋友相遇:研究字符
数组
转换字符串
你正在进行另一项令人兴奋的android应用评估,这个app存在了很多漏洞,你恐怕开发团队需要重新设计整个应用,而不是去修复这些让你想摧毁的bug,特别是当你遇见下面的加密密钥出现在你的输出栏中 加密密钥: ...
C#引用c++DLL结构体
数组
注意事项(数据发送与接收时)
最近做的项目,需要在C# 中调用C++ 写的DLL,因为C# 默认的编码方式是Unicode,而调用的DLL规定只处理UTF8编码格式的字符串,DLL中的输入参数类型
char
*被我Marshal成
byte
[],输出参数类型
char
**被我Marshal成了string...
【面试】吃透了这些Redis知识点,面试官一定觉得你很NB(干货 | 建议珍藏) c#自定义Attribute获取接口实现 纯JS ajax 聊聊DataTable下载 二进制数据的序列化反序...
【面试】吃透了这些Redis知识点,面试官一定...redis里存的都是二进制数据,其实就是字节
数组
(
byte
[]),这些字节数据是没有数据类型的,只有把它们按照合理的格式解码后,可以变成
一个
字符串,整数或对象,此时...
Java考试题
一:单选题 1.下列哪一种叙述是正确的(D)A.abstract修饰符可修饰字段、方法和类B. 抽象方法的body部分必须用一对大括号{ }包住C. 声明抽象方法,大括号可有可无D.声明抽象方法不可写出大括号 2.如下代码...
Java SE
62,612
社区成员
307,332
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章