如何用算法实现多国语言的自动识别功能?

Taylor_Tesla 2011-01-03 02:43:14
各位大虾,能否给我一个提示,我大概百度到了一些关于自动识别的思想,针对字符编码的特点来自动识别,但是我对字符编码不是很了解,麻烦有心人能否给我一些关于字符编码的书籍,让我能够了解一下,至于自动识别我想问问大家的想法,然后自己再实现一下,仅仅只需要大家的想法而已!
...全文
105 2 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
ForestDB 2011-01-04
  • 打赏
  • 举报
回复
如果是基于Unicode的,那么先看看Unicode的规范。
如果是MBCS的话,会麻烦些,需要对常用的单词和语句做统计预测。
wuyu637 2011-01-03
  • 打赏
  • 举报
回复
http://baike.baidu.com/view/40801.htm

看后面的Unicode 编码范围,如果字符时unicode,就可以根据范围知道语言的种类,

如果不是unicode,是gbk之类的,就比较麻烦,以为存在编码重复的问题

33,321

社区成员

发帖
与我相关
我的任务
社区描述
C/C++ 新手乐园
社区管理员
  • 新手乐园社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧