CVPR 2020 论文大盘点-图像与视频检索篇

本文总结CVPR 2020 中所有与图像和视频检索（Image and Video Retrieval）相关论文，总计 16 篇。

图像和视频检索常见于搜索引擎、商品服饰搜索等应用场景，另外为进行高效检索，该领域往往会将图像或者视频的特征通过哈希算法映射到二值空间，使用汉明距比较相似度，所以哈希算法也是该领域重要研究内容。

这部分论文方向比较分散，包括：

半监督图像检索 1篇，

组合查询图像检索 2篇

对抗图像检索 1篇

服饰检索 2篇

基于草图的图像检索 2篇

跨模态图像文本检索 2篇

跨模态视频文本检索 1篇

域适应图像检索 1篇

哈希算法 3篇

新数据集 1篇。

最有意思的、可能也是难度最大的是把文本和图像结合起来的组合查询图像检索和跨模态图像/视频-文本检索。

绝大部分论文代码开源或者即将开源，代码地址也一并附上了。

大家可以在：

http://openaccess.thecvf.com/CVPR2020.py

按照题目下载这些论文。

如果想要下载所有CVPR 2020论文，请点击这里：

CVPR 2020 论文全面开放下载，含主会和workshop

半监督图像检索

半监督图像检索

[1].Generalized Product Quantization Network for Semi-Supervised Image Retrieval

作者 | Young Kyun Jang, Nam Ik Cho

单位 | 韩国首尔大学

代码 | https://github.com/youngkyunJang/GPQ

组合查询图像检索

给定一幅查询图像和相关文本，检索出满足文本描述的与查询图像相似的图像(CVPR 2019新提出的检索新模式)

[2].Composed Query Image Retrieval Using Locally Bounded Features

作者 | Mehrdad Hosseinzadeh, Yang Wang

单位 | 曼尼托巴大学

联合文本反馈的图像搜索

[3].Image Search With Text Feedback by Visiolinguistic Attention Learning

作者 | Yanbei Chen, Shaogang Gong, Loris Bazzani

单位 | 伦敦玛丽女王大学；亚马逊

对抗图像检索（隐私保护）

通过对抗性扰动在哈希空间隐藏私有图像，对抗恶意图像检索

[4].Evade Deep Image Retrieval by Stashing Private Images in the Hash Space

作者 | Yanru Xiao, Cong Wang, Xing Gao

单位 | 欧道明大学；孟菲斯大学

代码 | https://github.com/sugarruy/hashstash

服饰检索

时尚服饰检索，用于识别仿冒品

[5].Which Is Plagiarism: Fashion Image Retrieval Based on Regional Representation for Design Protection

作者 | Yining Lang, Yuan He, Fan Yang, Jianfeng Dong, Hui Xue

单位 | 阿里；浙江工商大学；AZFT

解读 | 图像检索新方向，阿里提出区域检索算法｜CVPR 2020

服饰搭配检索

[6].Fashion Outfit Complementary Item Retrieval

作者 | Yen-Liang Lin, Son Tran, Larry S. Davis

单位 | 亚马逊

基于草图的图像检索

[7].Sketch Less for More: On-the-Fly Fine-Grained Sketch-Based Image Retrieval

作者 | Ayan Kumar Bhunia, Yongxin Yang, Timothy M. Hospedales, Tao Xiang, Yi-Zhe Song

单位 | 萨里大学；爱丁堡大学

代码 | https://github.com/AyanKumarBhunia/on-the-fly-FGSBIR

备注 | CVPR 2020 Oral

[8].Solving Mixed-Modal Jigsaw Puzzle for Fine-Grained Sketch-Based Image Retrieval

作者 | Kaiyue Pang, Yongxin Yang, Timothy M. Hospedales, Tao Xiang, Yi-Zhe Song

单位 | 萨里大学；伦敦玛丽女王大学；爱丁堡大学、

跨模态图像-文本检索

[9].Context-Aware Attention Network for Image-Text Retrieval

作者 | Qi Zhang, Zhen Lei, Zhaoxiang Zhang, Stan Z. Li

单位 | 中科院自动化所；国科大；西湖大学

代码 | https://github.com/labyrinth7x/CAAN（尚未）

[10].IMRAM: Iterative Matching With Recurrent Attention Memory for Cross-Modal Image-Text Retrieval

作者 | Hui Chen, Guiguang Ding, Xudong Liu, Zijia Lin, Ji Liu, Jungong Han

单位 | 清华大学；Kwai Ads Platform；微软；华威大学

代码 | https://github.com/HuiChen24/IMRAM

视频-文本检索

细粒度视频文本检索

[11].Fine-Grained Video-Text Retrieval With Hierarchical Graph Reasoning

作者 | Shizhe Chen, Yida Zhao, Qin Jin, Qi Wu

单位 | 中国人民大学；阿德莱德大学

代码 | https://github.com/cshizhe/hgr_v2t

域适应图像检索

[12].Probability Weighted Compact Feature for Domain Adaptive Retrieval

作者 | Fuxiang Huang, Lei Zhang, Yang Yang, Xichuan Zhou

单位 | LiVE；重庆大学；电子科技大学

代码 | https://github.com/fuxianghuang1/PWCF

哈希算法

无监督哈希算法

[13].Auto-Encoding Twin-Bottleneck Hashing

作者| Yuming Shen, Jie Qin, Jiaxin Chen, Mengyang Yu, Li Liu, Fan Zhu, Fumin Shen, Ling Shao

单位 | IIAI；电子科技大学

代码 | https://github.com/ymcidence/TBH

跨模态哈希，基于无监督知识蒸馏方法，可用于跨模态的检索问题

[14].Creating Something From Nothing: Unsupervised Knowledge Distillation for Cross-Modal Hashing

作者 | Hengtong Hu, Lingxi Xie, Richang Hong, Qi Tian

单位 | 合肥工业大学；华为

高效图像与视频检索

[15].Central Similarity Quantization for Efficient Image and Video Retrieval

作者 | Li Yuan, Tao Wang, Xiaopeng Zhang, Francis EH Tay, Zequn Jie, Wei Liu, Jiashi Feng

单位 | 新加坡国立大学；腾讯AI实验室；华为诺亚方舟实验室

代码 | https://github.com/yuanli2333/Hadamard-Matrix-for-hashing

数据集

谷歌地标检测数据集v2版-实例级识别和检索的大规模基准侧测试，是目前最大的实例检索与识别数据集，包含500万幅图像，20万个实例标签

[16].Google Landmarks Dataset v2 - A Large-Scale Benchmark for Instance-Level Recognition and Retrieval

作者 | Tobias Weyand, Andre Araujo, Bingyi Cao, Jack Sim

单位 | 谷歌

数据及代码 | https://github.com/cvdfoundation/google-landmark

推荐阅读：

备注：检索

图像与视频检索交流群

图像检索、视频检索、视频搜索、最近邻搜索等技术，

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看，让更多人看到