找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1833|回复: 0

[教程] PHP数组的Hash冲突实例

[复制链接]
发表于 2013-4-2 20:48:54 | 显示全部楼层 |阅读模式 来自 中国–广东–揭阳
PHP数组的Hash冲突实例,你知道不知道, 插入65536个经过构造的键值的元素到PHP数组, 会需要耗时30秒以上? 而一般的这个过程仅仅需要0.1秒..
         
          请看如下的例子:
        $size = pow(2, 16);
        $startTime = microtime(true);
        $array = array();
        for ($key = 0, $maxKey = ($size - 1) * $size; $key <= $maxKey; $key += $size) { $array[$key] = 0;
        }$endTime = microtime(true);
        echo '插入 ', $size, ' 个恶意的元素需要 ', $endTime - $startTime, ' 秒', ''; $startTime = microtime(true);
        $array = array();
        for ($key = 0, $maxKey = $size - 1;
        $key <= $maxKey; ++$key) { $array[$key] = 0;}$endTime = microtime(true);
        echo '插入 ', $size, ' 个普通元素需要 ', $endTime - $startTime, ' 秒', '';
          上面的例子, 在我的机器上的执行结果如下:
          插入 65536 个恶意的元素需要 43.1438360214 秒插入 65536 个普通元素需要 0.0210378170013 秒
          这个差别是不是很夸张?!
          我在上一篇文章中介绍过, 经过特殊构造的键值, 使得PHP每一次插入都会造成Hash冲突, 从而使得PHP中array的底层Hash表退化成链表:
        
          Hash collision

          这样在每次插入的时候PHP都需要遍历一遍这个链表, 大家可以想象, 第一次插入, 需要遍历0个元素, 第二次是1个, 第三次是3个, 第65536个是65535个, 那么总共就需要65534*65535/2=2147385345次遍历&hellip;.
          那么, 这个键值是怎么构造的呢?
          在PHP中,如果键值是数字, 那么Hash的时候就是数字本身, 一般的时候都是, index & tableMask. 而tableMask是用来保证数字索引不会超出数组可容纳的元素个数值, 也就是数组个数-1.
          PHP的Hashtable的大小都是2的指数, 比如如果你存入10个元素的数组, 那么数组实际大小是16, 如果存入20个, 则实际大小为32, 而63个话, 实际大小为64. 当你的存入的元素个数大于了数组目前的最多元素个数的时候, PHP会对这个数组进行扩容, 并且从新Hash.
          现在, 我们假设要存入64个元素(中间可能会经过扩容, 但是我们只需要知道, 最后的数组大小是64, 并且对应的tableMask为63:0111111), 那么如果第一次我们存入的元素的键值为0, 则hash后的值为0, 第二次我们存入64, hash(1000000 & 0111111)的值也为0, 第三次我们用128, 第四次用192&hellip; 就可以使得底层的PHP数组把所有的元素都Hash到0号bucket上, 从而使得Hash表退化成链表了.
          当然, 如果键值是字符串的话, 就稍微比较麻烦一些了, 但是PHP的Hash算法是开源的, 已知的, 所以有心人也可以做到&hellip;

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 需要先绑定手机号

关闭

站长推荐上一条 /1 下一条

QQ|侵权投诉|广告报价|手机版|小黑屋|西部数码代理|飘仙建站论坛 ( 豫ICP备2022021143号-1 )

GMT+8, 2024-12-23 02:45 , Processed in 0.045700 second(s), 9 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表