讨论一个解决方案,来者有分

萧霖 2009-08-06 01:20:42
我现在想做一个汉字转换成少数民族语言的转换软件,这里以维吾尔文为例吧,因为新疆讲维语的还是比较多,有一点市场价值。比如,我想要得到“北京”的维吾尔文。那我应该是像金山词霸一样,有一个词库,维护好了汉语和维语的对应关系。要找“北京”对应的维吾尔文就应该是从该词库中找出翻译。但是我不知道金山的词库是如何存储的,因为我看了下金山的词库文件打开都是一些看不懂的文字,我想应该是加过密的吧。思路就是和金山词霸一样进行翻译,但是汉语和维语的对应关系词库如何得到,即使得到了我该如何存储成自己的词库?大家有没有这方面的经验,或者其它的解决方案?谢谢,300分。
...全文
363 68 打赏 收藏 转发到动态 举报
写回复
用AI写文章
68 条回复
切换为时间正序
请发表友善的回复…
发表回复
LPR_Pro 2009-08-13
  • 打赏
  • 举报
回复
这种只能通过数据包实现,只是查找的时候,需要有比较快的算法,不然比较费时.
勤奋的沉沦 2009-08-13
  • 打赏
  • 举报
回复
散列 + 查找树?
B树?
nardolook 2009-08-13
  • 打赏
  • 举报
回复
up
limit_clear 2009-08-13
  • 打赏
  • 举报
回复
帮顶。
octopus666 2009-08-13
  • 打赏
  • 举报
回复
UP
光宇广贞 2009-08-13
  • 打赏
  • 举报
回复
来者
ysysbaobei 2009-08-13
  • 打赏
  • 举报
回复
顶下
xuxingok 2009-08-13
  • 打赏
  • 举报
回复
up
科技完美生活 2009-08-13
  • 打赏
  • 举报
回复
应该可以只是费时,接分
晒月光的青蛙 2009-08-12
  • 打赏
  • 举报
回复
先找个汉维词典的电子文档,建立索引关系,然后让用户输入找到对应的翻译
fairchild811 2009-08-12
  • 打赏
  • 举报
回复
用hash表啊,数据库存储
cl383804490 2009-08-12
  • 打赏
  • 举报
回复
我来报到了
萧霖 2009-08-12
  • 打赏
  • 举报
回复
[Quote=引用 54 楼 f22fbi 的回复:]
读入词库,和对应关系
建立hash表,然后序列化到硬盘
然后那个就是你的软件的词库了

我的设想,欢迎指正
[/Quote]

我也是这么想的,关键是词库不知道在哪可以弄到。Stardict里的词库我已经解压出来了,在WORD里可以看到正常的汉语词汇及维文解释。但是怎么组织成自己的词库文件呢,因为解压出来的文件没有统一的规则,写程序去读应该不太可能。现在我又想了解一下Stardict的词库是如何组织的,这样直接从他的文件里读,直接转成自己的词库文件就好了。
feather013 2009-08-11
  • 打赏
  • 举报
回复
UP一下
f22fbi 2009-08-11
  • 打赏
  • 举报
回复
读入词库,和对应关系
建立hash表,然后序列化到硬盘
然后那个就是你的软件的词库了

我的设想,欢迎指正
zhuxining 2009-08-11
  • 打赏
  • 举报
回复
[Quote=引用 49 楼 xiaolin317 的回复:]
我该如何在记事本中可以输入并正常显示维文?

在Word中却可以正常显示维文,这是为什么呢?我要把词库存储在记事本中。
[/Quote]

编码的问题,不同语言编码方式不一样。
zhanxuw 2009-08-11
  • 打赏
  • 举报
回复
[Quote=引用 8 楼 xiaolin317 的回复:]
词库我在网上找了下,在StarDict网上有《汉维词典》库,不过我下载后看不懂,也是乱码,估计也是加密过的。我正在研究如何把它读出来,使自己能看得懂,到时候如果成功的话就把这个词库拿来用。然后用这个词库建立自己的词库。不知道在建词库方面有没有什么好的方法或建议?主要是如何创建存储文件,如何建立文件索引,使查询速度达到最快。
[/Quote]

那个词库是二进制的文件,可以看stardict的文档,里面有说到文件格式。。
xxcclowlg 2009-08-11
  • 打赏
  • 举报
回复
记事本的词库是系统词库?
你没装维文系统字库?
fatiezhe 2009-08-11
  • 打赏
  • 举报
回复
词库肯定有前人做过了,一一对应的话还好说,但是如果两者语法语言现象有不同的话,就要用自然语言处理的方法来做翻译了
萧霖 2009-08-11
  • 打赏
  • 举报
回复
我该如何在记事本中可以输入并正常显示维文?

在Word中却可以正常显示维文,这是为什么呢?我要把词库存储在记事本中。
加载更多回复(48)

64,648

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧