请问一下,大家对做一个类似金山词霸类的软件有什么好主意?如何检索?是用数据库吗?

nevergrief 2004-06-20 09:30:47
请问一下,大家对做一个类似金山词霸类的软件有什么好主意?如何检索?是用数据库吗?


网上有没有相关的例子呢?非常感谢!
shutong_vc@hotmail.com
...全文
338 22 打赏 收藏 转发到动态 举报
写回复
用AI写文章
22 条回复
切换为时间正序
请发表友善的回复…
发表回复
袁尤军 2004-07-03
  • 打赏
  • 举报
回复
用B+树
CsdnRob 2004-07-02
  • 打赏
  • 举报
回复
nevergrief 2004-06-28
  • 打赏
  • 举报
回复
small_wei 2004-06-24
  • 打赏
  • 举报
回复
楼上大哥,我想做一个法语词典。根据已有的“法语助手”所说,用的公用的IDP 共享字库做成,可是我在网上却搜不到,这是为何?请指教!
这个我不清楚,我做的不是这个语系的,词库是自己拥有知识产权的。
至于查询算法,我估计用折半算法就可以了吧?
是没错的,这个算法简单容易实现,效率也高。我在查询中,同时使用了两种算法,以提高效率,你说的是其中之一。算法重要,但文件的存储结构更为重要,在查询中,最大的问题就是读取磁盘文件所花的时间,读取磁盘文件所花的时间比你在内存中进行检索词条所花的时间要多N十倍。
nevergrief 2004-06-23
  • 打赏
  • 举报
回复
楼上大哥,我想做一个法语词典。根据已有的“法语助手”所说,用的公用的IDP 共享字库做成,可是我在网上却搜不到,这是为何?请指教!

至于查询算法,我估计用折半算法就可以了吧?
small_wei 2004-06-23
  • 打赏
  • 举报
回复
词库文件是词霸中最有价值的东西,如果让你很容易看到它那不是很容易就能版它。如果词霸想做得各种语言都能通用,它就应该用UNICODE来存储,加上把自己的算法和结构写入文件中,你是不容易直接看到他的内容的。
我刚做了一个与词霸一样的翻译软件,词汇就是按我自己的算法和结构写入文件中,可以很高速查询到相关的词,当你拿到的的词库也不能直接运用的。在这个翻译软件中,最值钱的就是这个词库了。
金山词霸肯定不是用数据库的,如果用数据库,查询数据库会比直接查询文件要慢,对于这种简单的查询,光是从数据库中将查询结果传到你的应用程序所花的时间就比你在数据库的查询所花的时间要多,你的应用程序要得到从数据库中查询结果所花的时间就是这两者加起来的时间。
forswear 2004-06-22
  • 打赏
  • 举报
回复
估计用的不是数据库,数据库会很占资源的
梅文海 2004-06-22
  • 打赏
  • 举报
回复
我也认为最难的在于如何检索,屏幕取词不是难题,况且词霸的取词做的也不是很好用(在 VC6 就不是很好用),能在那么短的时间里找到相应的词是很不容易的(用数据库的话)。
hushuoqiu 2004-06-22
  • 打赏
  • 举报
回复
即指即译很有难度
xjtt2000 2004-06-22
  • 打赏
  • 举报
回复
金山词霸安装时从来没有要求有数据库或者Access,肯定是自己建立的文件索引,屏幕取词也不是什么难题?词霸的关键还是将数据素材录入。
nevergrief 2004-06-22
  • 打赏
  • 举报
回复
我看半天还是不明白啊。
6万个单词6万行,怎样实现快速检索?什么叫做“前两个字母分类”?

为什么安装完法语助手后(http://www.francochinois.com/),用editplus文件打开所有文件,没发现那个词库文件(被加密了?)
能不能加小弟的msn聊聊? wukw_fr@hotmail.com 或者QQ 47717895 ,解决完了,再给您我所有的分,非常感谢!!
PiggyXP 2004-06-21
  • 打赏
  • 举报
回复
就是用数据库了

其实词霸类的软件难在屏幕取词
jijuzheng 2004-06-21
  • 打赏
  • 举报
回复
你看看安装目录下的DICTS目录

好好看看词霸的安装目录
rivershan 2004-06-21
  • 打赏
  • 举报
回复
自己的算法咯
carbon107 2004-06-21
  • 打赏
  • 举报
回复
应是以自定义的文件形式来访问的,但是要用到一定的检索算法.
nevergrief 2004-06-21
  • 打赏
  • 举报
回复
就是只要能简单查询各单词就行了。其它的功能先都放一放,我也不一定做,只是想有点思路以后再做。
nevergrief 2004-06-21
  • 打赏
  • 举报
回复
自己写文件?比如说。。。
还是摸不着头脑啊,兄弟们能否说的详细一点??
kuibobo 2004-06-21
  • 打赏
  • 举报
回复
用自己的文件格式,然后在写一个好的查找算法

你可以看看词霸的字典的格式,显然不是数据库,而是金山弄的一个文件
virustrier 2004-06-21
  • 打赏
  • 举报
回复
词霸有两个难点
1、屏幕取词和识别
2、数据文件的建立

这次的2005版本取词上有了一些改进,我比较推崇那个连词分离
这个分离技术好像是通过字母匹配完成的

要在短时间内做到不是那么容易,而且还要考虑资源占用问题
small_wei 2004-06-21
  • 打赏
  • 举报
回复
一般不用数据库的,要自己写文件,设计算法,建立自己的索引。对于只有简单的查询功能的字典,自己做的查询做的好的话会比数据库快,而且不受用户环境的影响
加载更多回复(2)

16,472

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • Web++
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧