百度识图原理分析推测其发展方向 月光博客

2010年12月13日,百度推出相似图片搜索功能—“百度识图”(shitu.baidu.com)。常规的图片搜索,是通过输入关键词的形式搜 索到互联网上相关的图片资源,而百度识图则能实现用户通过上传图片或输入图片的url地址,从而搜索到互联网上与这张图片相似的其他图片资源,同时也能找 到这张图片相关的信息。

百度的相似图片搜索识图功能给大家提供两种搜索途径,一种是可以直接上传本地图片,另一个方式是输入图片的URL地址。无论是哪一种,从测试效果可看到,反应都很快。

针对这些笔者进行了几幅图的测试用以“肤浅”的分析百度识图的技术。

黑白图像测试

识图对于黑白图像,搜索结果是一样的。(不排除数据量少之类的情形)

测试不同类型的文件格式

主要针对gif动画的测试,测试结果为可以搜索到。应该为百度首先静态化了图像,或者说取了第一帧。

测试不同大小的文件

另外测试图像中,搜索结果中出现大小不同的图像,这说明百度是取像素点匹配的并且有固定取点个数。

测试黑白格子

这幅图像中,左边是搜索项,右边是结果,识图还可以把背景为该图片的搜索出来。简单推论:

第一步:黑白图像,彩色的图片变成黑白的,并且通过技术扩大黑白差异。

第二步:取点,根据灰度的不同,赋予不同的值,并且用矩阵形式存储起来。取点越多,图片就越精确,反之则不够精确。

第三步:根据用户搜索寻找完全匹配、部分匹配、周围匹配(背景图)图片。

推测百度以后发展方向

判断照片类型,根据不同类型建设不同的模型(矩阵)来判定图片类型。

彩色和黑白可以很好的分开

精确判断gif帧

延伸图片相关图片

根据图片搜索视频

识图现在搜索结果还是不够理想,有很大的提升空间,下面介绍几个比较专业的图片搜索引擎。

一:http://tineye.com/

Tineye是典型的以图找图搜索引擎,输入本地硬盘上的图片或者输入图片网址,即可自动帮你搜索相似图片,搜索准确度相对来说还比较令人满意。

二:http://www.gazopa.com/

GazoPa搜索图片时,不依据关键词进行检索,而是通过图片自身的某些特征(例如色彩,形状等信 息)来进行搜索。GazoPa搜索方式有三种:

第一种是传统的通过关键词搜索图片

第二种是创新的通过图片搜索图片

第三种是通过手绘图片搜索图片,这种方式其实没太大用处

第四种是通过视频缩略图搜索视频

三、http://similar-images.googlelabs.com/

Google实验室类似图片搜索:输入一个关键词后,例如“lake”,返回的页面里面点击某个图片的下面的Similar images,运用Google类似图片搜索功能引擎,即刻为你把类似的图片全部搜索出来,展示给用户以便查看。其准确率、相似率相对比较高。

四、http://www.picitup.com/

Picitup是一个刚开始公测的专业图片搜索引擎,功能非常强大,并支持中文关键字的搜索,是国内图片爱好者的不错选择。

五、http://www.tiltomo.com/

Tiltomo是由Flickr开发的一个搜索工具,主要用来维护Flickr自己的图片数据库, 其搜索算法主要是基于相似的主题风格或相似的色调和材质。

六、http://labs.ideeinc.com/upload/

Byo image search是根据你上传的图片来搜索相似的图片,算法主要是基于色彩,也包括主题风格。

七、http://cn.bing.com/

Live.com允许你进行一次关键字搜索后再执行相似性的搜索。你可以为Live索引中的任意一张图片寻找相似的图片,但搜索结果看起来并不是很精确。

八、http://www.xcavator.net

Xcavator和Live.com很相似,你需要先输入一个关键字,然后在搜索结果中挑选一张图片,在根据这张图片的特点来进行搜索。

九、http://www.incogna.com

Incogna的搜索速度非常快,主要是基于色彩和形状上的相似性。

十、http://www.terragalleria.com

Terragalleria主要基于视觉上的相似性,而不考虑图片的内容。

来源:科易网作者:一剑倾城