社区
基础编程
帖子详情
求php的hash算法
xiaotao5
2010-11-10 10:59:19
今天看phpcms的采集目录,发现里面有个title目录,里面有很多两位文件名的文本文件,文件内容都是md5值,我的直觉告诉我,这个是根据标题来做的仿重复采集实现方。思路应该是这样的,把采集到的标题用hash算法生成文件名,然后把标题的md5值保存到文件中,这样多次采集的标题被分散保存到很多文件中,应该可以大幅提高效率,且减少了因为单纯用md5值出现撞针的几率。
我最近在给我自己的系统做采集仿重复功能,只是不懂这个hash算法,请高人们指导下!
...全文
103
4
打赏
收藏
求php的hash算法
今天看phpcms的采集目录,发现里面有个title目录,里面有很多两位文件名的文本文件,文件内容都是md5值,我的直觉告诉我,这个是根据标题来做的仿重复采集实现方。思路应该是这样的,把采集到的标题用hash算法生成文件名,然后把标题的md5值保存到文件中,这样多次采集的标题被分散保存到很多文件中,应该可以大幅提高效率,且减少了因为单纯用md5值出现撞针的几率。 我最近在给我自己的系统做采集仿重复功能,只是不懂这个hash算法,请高人们指导下!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
xiaotao5
2010-11-12
打赏
举报
回复
我已经做到了,采用sha1生成标题摘要,取前两位做为文件名,标题的md5做为文件内容用|分隔,实际效果非常理想,进行10万次测试,结果均匀分布在256个文件中,而且没有出现撞针现象!
cuidenghong123
2010-11-11
打赏
举报
回复
床上等您
2010-11-11
打赏
举报
回复
想知还是自己看源码吧。
md5是基于md4算法的。可以google一下。
在-云端
2010-11-11
打赏
举报
回复
之前我这边就有个类似的东西是这样做的!
主要是由于文件众多,需要分散目录进行组织.
php
hash
算法
PHP
的
hash
算法
是指将任意长度的输入数据通过一系列的数学运算转换为固定长度的输出数据的
算法
。这种转换称为哈希。哈希
算法
常用于密码加密、数据校验、数据存储等场合。
PHP
提供了若干个内置的哈希函数,如 md5...
PHP
如何使用
hash
,
PHP
-
php
hash
算法
使用
hash
算法
一般是利用数组实现的,步骤如下:存元素时:1.把要存储的元素(value)计算一个
hash
code(称为散列),这个就是key。2.把元素存储到以
hash
code为下标的数组中。3.若此数组下标已经有元素,则使用链表的方式把...
PHP
中的
Hash
算法
PHP
中的
Hash
算法
Hash
Table是
PHP
的核心,这话一点都不过分.
PHP
的数组,关联数组,对象属性,函数表,符号表,等等都是用
Hash
Table来做为容器的.
PHP
的
Hash
Table采用的拉链法来解决冲突, 这个自不用多说, 我今天...
DJB
Hash
Function,也称times33
算法
,
php
的实现与分析-
算法
DJBX33A又叫Times33哈希
算法
的实现与分析
算法
:对字符串的每个字符,迭代的乘以33,目的把字符串转换成整数 公式:
hash
(i) =
hash
...为什么要用33,因为33是一个素数,能更好的散列,
PHP
内置的
Hash
函数用的素数...
一致性
hash
算法
- consistent
hash
ing
一致性
hash
算法
(consistent
hash
ing)张亮consistent
hash
ing
算法
早在1997年就在论文Consistent
hash
ing and random trees中被提出,目前在cache系统中应用越来越广泛;1基本场景比如你有N个cache服务器(后面简称c
基础编程
21,886
社区成员
140,364
社区内容
发帖
与我相关
我的任务
基础编程
从PHP安装配置,PHP入门,PHP基础到PHP应用
复制链接
扫一扫
分享
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章