怎么实现自动识别串口接收的数据是GB2312还是unicode，BIG5

tao20002008 2018-06-13 02:50:16

通过程序怎么实现自动识别串口接收的数据是GB2312还是unicode，BIG5的编码格式？
本人通过识别到的编码格式，进行LCD显示。

就是让自己的设备支持多种编码格式；支持GB2312,UNICODE,BIG5等；

...全文

816 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

of123 2018-06-14

打赏
举报

回复

有希望了。重点在编码范围上。 GB2312 编码范围：A1A1－FEFE。（第二字节均起始于 A0） A1A0-A3FE：标点符号、序号、数字和西文字母。 A4A0-A8E9：日文假名、俄文字母、拼音字母和注音字母。 A9A0-A9EF：制表符。 B0A0-F7FE：汉字。 BIG5 编码范围： A140-A3BF 标点符号、希腊字母及特殊符号。 A440-C67E 常用汉字。 C6A1-F9DC 其它汉字。 F9DD-F9FE 制表符。 Unicode 汉字编码范围： 3000-303F：中日韩标点符号。 4E00-9FBF：CJK 统一表意符号（汉字）从编码范围看，Unicode 很容易区分。 GB2312 与 Big5 范围有重叠。但还是可以利用其中非重叠部分区分。也可以用常出现的标点符号来识别规范的文本。 Big5 中第二字节可小于 A0，GB2312 不可。例如，Big5 中 “，” 的编码是 0xA141，“。” 的编码是 0xA143，它们不在 GB2312 编码范围内。在 GB2312 中 “。” 的编码是 0xA1A3。

of123 2018-06-13

打赏
举报

回复

要么让发送方先发固定内容供识别，要么就用人工智能。当然，还有一种方法，就是建立“乱码”字库。把一些本来是常用语的字符识别成基本不用的生僻字的情况识别出来。当然，如果信息量小，命中率就不高了。总之，人识别“乱码”很容易，机器识别很难。计算机唯一的优势是快，它可以把所有可能都试一遍，然后判断是否合理。

这节课教大家去写自动化软件，也就是让电脑自动模拟用户行为，自动去打开软件，自动点击按钮。这个技能非常实用，用的好可以一本万利，实现财务自由。很多人靠写一个自动化工具，一个月就能卖个好几百万单，挣得盆满钵满。这就是技术优势，而对于大多数人来说根本就写不出来，也就只能在低处观望。这是客户花费了两万多让我制作的一个自动化软件，我把里面的核心功能与代码提取出来，视频讲解并分享给大家。最后再把价值两万的源码分享给大家。当然如果想自己去研究的同学也可以花一两个月时间自己去找资料研究，时间成本差不多也是两万。各大行业都可以使用，在电脑上人为手动的操作，都可以进行模拟，让程序自动化去完成你的所有动作。比如：财务记账自动填充数据自动去提交，软件自动化测试，游戏自动挂机脚本，远程电脑操控，电商商品自动录入，以及自媒体自动化营销。课程内容有：模拟鼠标与键盘，自动电脑里的软件，图像识别算法点击屏幕里的按钮，远程服务操控电脑

语言介绍： 1.自然语言（中文英文日文等等）2.逻辑语言（也称为编码语言，通过不同的编码方式进行编码定义，例如国际码 Unicode 中国的GBK、GB2312、BIG5等等）3.机器语言（也就是计算机能够直接处理的二进制语言）（可以理解为不同的软件产生了数据，这些数据要有对应的协议或者服务定义，应用层定了这些服务例如HTTP 、DHCP、DNS、SMTP 等等）MAC---介质访问控制子层（二层进行地址的识别）（不在同一网段）（数据的编码解码、数据的加密解密、数据的压缩和解压缩等等）

文章目录一、简介二、功能特点三、命令帧1.命令帧格式2.控制命令四、通信函数1.串口2.SYN6288五、文本控制标记列表六、声音提示音列表七、和弦提示音列表一、简介 SYN6288中文语音合成芯片是背景宇音天下科技有限公司与2010年初推出的一款性价比更高，效果更自然的一款中高端语音合成芯片。SYN6288通过异步串口（UART）通信方式，接收待合成的文本数据实现文本到语音（或TTS语音）的转换。二、功能特点支持GB2312、GBK、BIG5和UNICODE内码格式的文本每次合成的文本量最多可达

Unicode 1. 编码知识 1.1 文本和字符在计算机程序中或者数据文件里，文本（text）是作为数字序列存储的。序列中的数字是具有不同大小、取值和解释的整数。如何解释这些整数是由字符集（character set）、编码（encoding）决定的。文本主要是由字符（character）组成。在格式文本（fancy text, or rich text）中包括显示属性，如颜色、斜...

中文乱码,之所以出现这种现象,根本原因是解析和编码所按照的字符集不同,而字符集是什么呢?```字符集(Character set)是多个字符的集合，字符集种类较多，每个字符集包含的字符个数不同，常见字符集名称：ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字，需要进行字符编码，以便计算机能够识别和存储各种文字。...

单片机/工控

27,373

社区成员

28,771

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章