很多,很碎的文件能否建hash表??

erbao78 2006-03-10 08:46:51
我的程序很多,很碎,不知能否建立hash表

程序如下:
一共158,240个小文件(每个到不大,几百吧),
1
每个文件进行处理(stoplist,stemming)------词频统计

2 将这么多小文件合并起来杂做??(我想建立一个 单词 =〉词频统计hash表)

主要考虑时间复杂度,怎样做好??

CPU Pentium IV 3G
内存 1G
...全文
130 3 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
ydogg 2006-03-17
  • 打赏
  • 举报
回复
1。hashtable处理大量数据还是有优势的,当然前提是hash算法不能太烂
2。如果文件数的确很多,也可以考虑分别存放于多个独立hashtable中
蒋晟 2006-03-11
  • 打赏
  • 举报
回复
用b树找起来快些
xyzxyz1111 2006-03-10
  • 打赏
  • 举报
回复
如果内存不够,可以适用gdbm, bsddb等数据库。和字典的使用方法一样。

37,743

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • WuKongSecurity@BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧