社区
脚本语言
帖子详情
很多,很碎的文件能否建hash表??
erbao78
2006-03-10 08:46:51
我的程序很多,很碎,不知能否建立hash表
程序如下:
一共158,240个小文件(每个到不大,几百吧),
1
每个文件进行处理(stoplist,stemming)------词频统计
2 将这么多小文件合并起来杂做??(我想建立一个 单词 =〉词频统计hash表)
主要考虑时间复杂度,怎样做好??
CPU Pentium IV 3G
内存 1G
...全文
173
3
打赏
收藏
很多,很碎的文件能否建hash表??
我的程序很多,很碎,不知能否建立hash表 程序如下: 一共158,240个小文件(每个到不大,几百吧), 1 每个文件进行处理(stoplist,stemming)------词频统计 2 将这么多小文件合并起来杂做??(我想建立一个 单词 =〉词频统计hash表) 主要考虑时间复杂度,怎样做好?? CPU Pentium IV 3G 内存 1G
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
ydogg
2006-03-17
打赏
举报
回复
1。hashtable处理大量数据还是有优势的,当然前提是hash算法不能太烂
2。如果文件数的确很多,也可以考虑分别存放于多个独立hashtable中
蒋晟
2006-03-11
打赏
举报
回复
用b树找起来快些
xyzxyz1111
2006-03-10
打赏
举报
回复
如果内存不够,可以适用gdbm, bsddb等数据库。和字典的使用方法一样。
计算与数据结构篇 - 哈希算法 (
Hash
)
本文深入探讨哈希算法原理及应用,包括安全加密、唯一标识、数据校验、散列函数、负载均衡、数据分片及分布式存储。通过具体实例解析哈希算法在实际场景中的运用。
哈希算法
本文深入探讨哈希算法的原理及应用,包括安全加密、唯一标识、数据校验等多个方面,同时解析哈希算法在分布式系统中的关键作用。
相似图像搜索的哈希算法思想及实现(差值哈希算法和均值哈希算法)
本文介绍图像相似度比较的哈希算法,包括哈希的概念、哈希函数特点、哈希算法种类。详细阐述均值、差值、感知三种哈希算法步骤,还提及汉明距离用于对比图片指纹。最后给出代码实现和运行结果,并比较三种算法,如均值哈希快但不精确,感知哈希精确但慢等。
哈希算法(哈希函数)基本
本文深入介绍了哈希(
Hash
)的概念,解析了哈希算法的工作原理及其特性,包括单向性、灵敏性和抗碰撞性等。同时,文章还列举了哈希的实际应用场景,如数据校验、安全加密和数字签名等,并详细阐述了几种典型哈希函数(MD5、SHA系列)的具体实现过程。
什么是哈希(
hash
)
哈希算法是一种将任意长度输入转化为固定长度输出的加密技术,具有不可逆和计算快速的特性。在Python中,哈希用于dict和set数据结构,提升查询速度并实现去重功能。例如,dict通过哈希实现快速查找,set在存储元素时通过哈希确定唯一位置以避免重复。哈希广泛应用于密码存储、
文件
校验和数字签名等领域。
脚本语言
37,740
社区成员
34,211
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章