VP-TREE树结构算法
有谁写过或比较详细的文档描述VP-TREE树结构的构造。网上这几天搜索过一遍,就老外一篇 Data Structures and Algorithms for Nearest Neighbor Search in General Metric Spaces ,但是还是对它的树最终构造结构还是不太了解,特别是所谓的media值的选取。
我现在想构造一个二进制相似邻居搜索,除了VP-TREE(Binary space partitioning tree)外还有没更好的算法。以前有看过GOOGLE关于相似邻居搜索(去除网页重复)论坛,提到过SIMASH算法,但是SIMHASH算法中的搜索实在太过复杂,一直没搞明白怎么划分它的fingerpring。