如何得到用户的词库?!求一个非常简单的程序!

v729 2005-06-22 08:20:16
本人用拼音加加一段时间后,就可以得到比较大的词库,里面有本人的自定义词组!

本人想提取出来!格式如:

http://community.csdn.net/Expert/topic/4076/4076888.xml?temp=.1550257

可能词库量有亿!怎么用比较快的方法提取?顺序是乱序的!

一个网友已经提供了,可是那个没有达到我要的要求,但是大部分的分都给了他!

因为我要的是软件,不是程序代码!

做出那个软件后,可以放到我的网络空间

http://v729.ys168.com/ 的“临时2”文件夹,密码:123456

如果不够空间,也可以放到,http://v729gx.ys168.com/

同时,留下你在这个网站的昵称!
...全文
194 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
僵哥 2005-07-10
  • 打赏
  • 举报
回复
呵呵,楼主只考虑了取词的时间,没有考虑排序也需要时间及资源的花费。
现假设需合并的两个文件各为1亿个词汇:

冒泡排序的时间复杂度为:O(n)=(N-1)/2*N+(N%2==0?(N/2):0);
那么做一亿个元素的数据排序则复杂度为:(1亿-1)/2+1亿/2
两个则是:(1亿-1)*1亿+1亿
而另外在合并时还需要做一次同步的低度扫描,则在这当中的消耗是多少?
而直接使用相同算法查找的话,复杂度为:1亿*1亿

又如何说排序还会快呢?排序只不过是对多次重复性的搜索提高效率。而非所有场合都是最合理的,毕竟本身需要消耗。
v729 2005-07-10
  • 打赏
  • 举报
回复
我不是给你留言了吗?没有收到?

虽然很简单,但是你还没有做出来。
你做的是把两个词库合并,而不是从B词库提取A词库没有的单词!

A词库有的,B词库有,如果你从A词库一个一个单词去从B词库查找,那么,要很多的时间,如果是上亿个,那么,不知道程序何时能完成。

有一个思路可以简化,就是把A词库和B词库按一个顺序排列,用冒泡算法。
接着,A词库和B词库两两各自头一个一个比较,a词库第一个词组和b词库第一个词组比较,a词库第二个词组和b词库第二个词组比较。。。。。。。。。。。
如果发现不同,就用a词库那个词组,对B词库的剩下词组进行查找,找到后,就把b词库刚刚查找经过的词组提取,因为那是a词库没有的。

你看一看,这个思路对程序的效率是不是提高很多倍?
僵哥 2005-07-09
  • 打赏
  • 举报
回复
楼主所要的不就是一个简单的程序,简单的程序,偶都已经传上去了,至于啥叫没有解决,偶就不得而知了。再说偶也没那空做这种几近无聊之事。
v729 2005-07-08
  • 打赏
  • 举报
回复
还是没有解决.
v729 2005-07-02
  • 打赏
  • 举报
回复
非常急!

想马上得到那个软件!

其实,词库是100万左右!

如果得到了,我有上千分!你想要多少?!
僵哥 2005-07-02
  • 打赏
  • 举报
回复
加QQ群:11141442
僵哥 2005-06-27
  • 打赏
  • 举报
回复
要知道一亿个词组,单一个词组一个两个汉字来算,再加换行加车符就是(4+2)字节*100000000大小为570MB+,若将两个这样的文件装载到StringList当中,那么基本上就算是服务器的配置未必能支持得了。所以要是不想自己太过麻烦的处理,建立还是使用如MS_SQL Server之类来处理比较好。
v729 2005-06-26
  • 打赏
  • 举报
回复
天啊,怎么回事?
v729 2005-06-25
  • 打赏
  • 举报
回复
这个有那么难吗?!
Earthnut 2005-06-23
  • 打赏
  • 举报
回复
......

2,507

社区成员

发帖
与我相关
我的任务
社区描述
Delphi 数据库相关
社区管理员
  • 数据库相关社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧