VP-TREE树结构算法

menuvb 2011-08-12 12:15:16
有谁写过或比较详细的文档描述VP-TREE树结构的构造。网上这几天搜索过一遍,就老外一篇 Data Structures and Algorithms for Nearest Neighbor Search in General Metric Spaces ,但是还是对它的树最终构造结构还是不太了解,特别是所谓的media值的选取。

我现在想构造一个二进制相似邻居搜索,除了VP-TREE(Binary space partitioning tree)外还有没更好的算法。以前有看过GOOGLE关于相似邻居搜索(去除网页重复)论坛,提到过SIMASH算法,但是SIMHASH算法中的搜索实在太过复杂,一直没搞明白怎么划分它的fingerpring。
...全文
826 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
ln95811167 2012-04-25
  • 打赏
  • 举报
回复
VP-tree的应用有限制么?我现在在看sift的特征匹配,但是基本都是用的K-D-tree,SR-tree或者LSH,但是现在有很多度量空间的索引结构比如VP-tree,能否应用到sift的匹配呢?就是说不同类型的索引有应用限制么?
leiting321 2011-08-21
  • 打赏
  • 举报
回复
学习路过
adelldell 2011-08-20
  • 打赏
  • 举报
回复
仰望楼上。。
前一段时间读了一篇文章。说是现在主张利用云计算技术来改造我们的IT基础平台。
合掌祈求得以实现啊。。。
小白一个,LZ不妨参考楼上几位的回答。
一叶之舟 2011-08-19
  • 打赏
  • 举报
回复
向上面几位学习了。
超级大笨狼 2011-08-15
  • 打赏
  • 举报
回复
我们管向量叫做DNA链。

假设DNA的前半部分的和,比后边的大,我们叫做男人,否则是女人。
男人放左边的桶,女人放右边的桶。
如果前后差距不大,假设比例是0.55比0.45,这种是李宇春,两边桶都放。

接下来,再比较4分之1,4分之2,3,4.。。
重复上面的规则,分桶,模糊的两边都放。

这样,分4层下来,大概是128个桶,5层以上就适合万亿级别的数据了。

需要比对的时候,只需要知道当前向量是属于哪个桶里的,在桶里去比较就可以了。

比较可以用余弦相似度,欧式距离,马氏距离神马的,随意你选择。

比如来了成龙,你就不需要去女人堆里去比,
来了饭岛爱,你不要去男人堆里比。
来了曾哥,你需要到两边的桶里去比,但是多层分类的话,命中的桶树是有限的,除非是超级李宇春,DNA象国际象棋盘一样黑白相间。

这个办法可以比对数亿个指纹,人脸,图片神马的向量。
还可以比对腾讯微博和新浪微博里,哪两个人是一个。

明白?

33,008

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧