《Aggregating local descriptors into a compact image representation》论文笔记
这篇论文中提出了一种新的图片表示方法,也就是VLAD特征,并把它用于大规模图片检索中,得到了很好的实验结果。
目前,BOF在图片检索和分类中应用广泛,首先是因为BOF是基于比较powerful的local特征(如SIFT)得来的,所以表达能力很强;其次是因为计算BOF过程中用到的kmeans也是根据样本在样本空间的距离来聚类的,所以,BOF也可以输入SVM这类基于样本间隔的分类器得到较好的效果。但是在数据量很大的情况下,由于vocabulary大小的限制,BOF的特征表达会越来越粗略,特征信息损失较多,使得搜索精度降低。
这篇论文在大数据量的图片搜索问题上,做了3方面的优化:
1,优化特征表示方法,使用VLAD特征;
2,对降维方法(PCA)做改进
3,对索引方法(ADC)做改进
论文的主要贡献有2个:
1,基于BOF和Fisher vector这这两种聚合local特征的方法提出了VLAD特征;
(
BOF详细内容见:http://blog.csdn.net/happyer88/article/details/
Fisher vector详细内容见:http://blog.csdn.net/happyer88/article/details/
)
2,对降维方法和索引方法做优化,而这两个优化是trade-off的,也就是此消彼长的关系,所以,论文中通过大量实验得到一个平衡值。
VLAD: vector of locally aggregated descriptors
要在大数据量的图片中搜索图像,对图片集中的每幅图片,首先是要提取VLAD特征,把每幅图片表示成一个VLAD向量v:

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/123608.html