图像检索的解决方案

tony_dagoo 2008-07-23 03:03:45
简单说下,有个10万张图片的库按日期分成文件夹存放,大约10GB. 现在手头上有张图片,需要在这图库是检索出和这张图片相似的图片. 检索时间小于10秒.

求方案.


由于检索时间限制,不可能每次都把10G的文件重新读取.因此想把图片库先预处理并只把特征码存到DB中.我相大概的情况应该是这样.

1.先把这10万图片提取特征码(网上搜了一大堆的方案)=>存进DB

2.需检索的图片=>提取特征码

3.用quary从数据库中按特征码查找.


现在关键是在提取特征码这步不知道选择什么方案.存到数据库里怎么个存法.由于图片的检索需要有个阀值来调节控制最后结果的数量和相似度,这个不知道怎么通过quary来查询.

各位不知道有没做过这方面.大家讨论一下.

另:
图片多为证件的扫描图.需要再检索的原因是不断有人用ps的图片来糊弄人.如果有高人能通过统计的方法来分析图片局部是否有ps(模糊,剪贴...).也请提点一下.

谢谢各位.
...全文
184 11 打赏 收藏 转发到动态 举报
写回复
用AI写文章
11 条回复
切换为时间正序
请发表友善的回复…
发表回复
QDCJAVA 2010-10-11
  • 打赏
  • 举报
回复
我也在想这样一个项目,国外有一个软件JPEGsnoop可以检测,不过准确度有点低。我查了下资料基本原理有这几种

a.通过鉴别图像内嵌的EXIF信息是否被修改来判断图像是否被修改。
b.可以通过像素或者灰阶等差异值,对比图片内容的可疑区域和其他正常区域,从而判断可疑区域是否被修改过。
c.可以通过图片的信息显示质量和相机的保存压缩性质文件对比上述常用的图片编辑软件的压缩签名,从而判断图像是否被篡改,甚至用何种软件/方式被修改。
(具体鉴别原理可参考一款国外免费软件JPEGsnoop)
tony_dagoo 2008-07-31
  • 打赏
  • 举报
回复
谢谢各位哈.这个贴子同时发了三次,还是.net版的兄弟们最热心哈 .

to lixueming3000
真有做过?那说来听听....

to zlkingdom
PS 过后虽然是新的图片.但点和点之间的关系由于是用算法新生成的(锐化,模乎等等.) 我觉得必然有种逻辑关系.但只从局来看,未必能看出什么,但从整张图来看这种有特征点的部用统计的必然会不平均.

有些图片长的很像,所以要找合适的取特征点的方法.并且在后期检索时需要用特征码+相似度可以用来匹配记录.可特征码只能生成一次.怎么样才能更多的表现图片细结,并且可以配合相似度来找到适合的图片.

to csShooter
不算什么项目.公司现在实行一种身份认证,但总有造假者ps图片后上传,目前人眼来识别图片,这个工作是为了提高效率和准确率.

再次感谢关注和帮顶的同学.
  • 打赏
  • 举报
回复
帮你顶
yagebu1983 2008-07-23
  • 打赏
  • 举报
回复
关注!!
学习!!
晓疯馋曰 2008-07-23
  • 打赏
  • 举报
回复
关注,期待好的方案出现!
csShooter 2008-07-23
  • 打赏
  • 举报
回复


楼主做什么项目??...


tony_dagoo 2008-07-23
  • 打赏
  • 举报
回复
/hoho
谢谢帮顶的同学.

存特征码没问题.关键是如何用阀值来调节控制最后结果的数量和相似度...这个没想通.

另外图片虽然经过ps 但点和点之间的关系应该还有些统计方面的规律,只是没做过.期待高人
zlkingdom 2008-07-23
  • 打赏
  • 举报
回复
PS以后也成为了一张新的图片啊,怎么能通过图片的二进制代码分辨出来呢...
图片的特征码的提取主要还是在于你自己定义的规则,网上关于这方面的资料很多的,存数据库的时候只存特征部分就可以了
关注~~~!!!
qyulang 2008-07-23
  • 打赏
  • 举报
回复
哈哈,mark
lixueming3000 2008-07-23
  • 打赏
  • 举报
回复
没有做过,在帮顶一下。。。
lixueming3000 2008-07-23
  • 打赏
  • 举报
回复
这个要求,还真有做过。。。。

111,125

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Creator Browser
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧