- 论文地址:
- 代码地址:
- 主要工作:
- 核心思想:
- 具体实现:
-
- CLIP:
- DECLIP:
- 实验结果:
https://arxiv.org/abs/2110.05208
代码地址:https://github.com/Sense-GVT/DeCLIP
主要工作:CLIP需要使用 400M 的图像-文本对来进行训练,而作者表明可以通过广泛利用数据集中的互监督、自监督信息来加速训练。在此基础上提出了 DeCLIP,使用了比 CLIP 小 7.1 倍的数据实现了 0.8 % 的新能提升(ResNet50 on ImageNet),并且在下游的 11 个任务中



