As Firm As Their Foundations: Can open-sourced foundation models be used to create adversarial examples for downstream tasks?

Hu, Anjun; Gu, Jindong; Pinto, Francesco; Kamnitsas, Konstantinos; Torr, Philip

Computer Science > Computer Vision and Pattern Recognition

arXiv:2403.12693 (cs)

[Submitted on 19 Mar 2024]

Title:As Firm As Their Foundations: Can open-sourced foundation models be used to create adversarial examples for downstream tasks?

Authors:Anjun Hu, Jindong Gu, Francesco Pinto, Konstantinos Kamnitsas, Philip Torr

View PDF

Abstract:Foundation models pre-trained on web-scale vision-language data, such as CLIP, are widely used as cornerstones of powerful machine learning systems. While pre-training offers clear advantages for downstream learning, it also endows downstream models with shared adversarial vulnerabilities that can be easily identified through the open-sourced foundation model. In this work, we expose such vulnerabilities in CLIP's downstream models and show that foundation models can serve as a basis for attacking their downstream systems. In particular, we propose a simple yet effective adversarial attack strategy termed Patch Representation Misalignment (PRM). Solely based on open-sourced CLIP vision encoders, this method produces adversaries that simultaneously fool more than 20 downstream models spanning 4 common vision-language tasks (semantic segmentation, object detection, image captioning and visual question-answering). Our findings highlight the concerning safety risks introduced by the extensive usage of public foundational models in the development of downstream systems, calling for extra caution in these scenarios.

Subjects:	Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2403.12693 [cs.CV]
	(or arXiv:2403.12693v1 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2403.12693

Submission history

From: Anjun Hu [view email]
[v1] Tue, 19 Mar 2024 12:51:39 UTC (45,305 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:As Firm As Their Foundations: Can open-sourced foundation models be used to create adversarial examples for downstream tasks?

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:As Firm As Their Foundations: Can open-sourced foundation models be used to create adversarial examples for downstream tasks?

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators