向量的相似度,请问如何设计一个二叉树,让搜索复杂度从O(N)降低到O(lgN)

超级大笨狼 2011-06-11 09:16:54
有几万个不同的向量,数字都是1-100内的小正整数
[1,3,27,8,6,12,7,19....]
[4,23,27,18,6,12,7,23....]
[1,33,27,8,16,12,37,56....]
....
几万个

向量长度,就是逗号个数相同,每个都是4000

找出和输入向量,最相似的那个。
比如输入:
[10,3,2,7,18,6,2,7,9....]

相似度用向量夹角余弦值。q和d


请问如何设计一个二叉树,让搜索复杂度从O(N)降低到O(lgN)

数据请随机模拟即可。

...全文
165 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
woshi_ziyu 2011-07-21
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 superdullwolf 的回复:]

那又回到C均值聚类核算法里了,要求出核在哪里,正头痛呢。
下周丢给算法小组去研究了,耗费我太多精力了。
[/Quote]
++
超级大笨狼 2011-06-12
  • 打赏
  • 举报
回复
那又回到C均值聚类核算法里了,要求出核在哪里,正头痛呢。
下周丢给算法小组去研究了,耗费我太多精力了。
绿色夹克衫 2011-06-11
  • 打赏
  • 举报
回复
kdTree似乎比较合适,但效率未必有这么乐观。可以先弄一个做测试,先看准确率,效率方面还可以通过简化向量里面的信息来提高效率。
超级大笨狼 2011-06-11
  • 打赏
  • 举报
回复
就是给出一个比较规则Icompare
超级大笨狼 2011-06-11
  • 打赏
  • 举报
回复
笔误已修改
超级大笨狼 2011-06-11
  • 打赏
  • 举报
回复
降低到O(lgN)笔误,呵呵~~

2,408

社区成员

发帖
与我相关
我的任务
社区描述
高性能计算
社区管理员
  • 高性能计算社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧