DifAttack++: Query-Efficient Black-Box Adversarial Attack via Hierarchical Disentangled Feature Space in Cross Domain

Liu, Jun; Zhou, Jiantao; Zeng, Jiandian; Tian, Jinyu

Computer Science > Computer Vision and Pattern Recognition

arXiv:2406.03017v2 (cs)

[Submitted on 5 Jun 2024 (v1), revised 13 Jun 2024 (this version, v2), latest version 1 Jul 2024 (v3)]

Title:DifAttack++: Query-Efficient Black-Box Adversarial Attack via Hierarchical Disentangled Feature Space in Cross Domain

Authors:Jun Liu, Jiantao Zhou, Jiandian Zeng, Jinyu Tian

View PDF HTML (experimental)

Abstract:This work investigates efficient score-based black-box adversarial attacks with a high Attack Success Rate (ASR) and good generalizability. We design a novel attack method based on a \textit{Hierarchical} \textbf{Di}sentangled \textbf{F}eature space and \textit{cross domain}, called \textbf{DifAttack++}, which differs significantly from the existing ones operating over the entire feature space. Specifically, DifAttack++ firstly disentangles an image's latent feature into an \textit{adversarial feature} (AF) and a \textit{visual feature} (VF) via an autoencoder equipped with our specially designed \textbf{H}ierarchical \textbf{D}ecouple-\textbf{F}usion (HDF) module, where the AF dominates the adversarial capability of an image, while the VF largely determines its visual appearance. We train such autoencoders for the clean and adversarial image domains respectively, meanwhile realizing feature disentanglement, by using pairs of clean images and their Adversarial Examples (AEs) generated from available surrogate models via white-box attack methods. Eventually, in the black-box attack stage, DifAttack++ iteratively optimizes the AF according to the query feedback from the victim model until a successful AE is generated, while keeping the VF unaltered. Extensive experimental results demonstrate that our method achieves superior ASR and query efficiency than SOTA methods, meanwhile exhibiting much better visual quality of AEs. The code is available at this https URL.

Comments:	arXiv admin note: substantial text overlap with arXiv:2309.14585 An extension of the AAAI24 paper "DifAttack: Query-Efficient Black-Box Attack via Disentangled Feature Space."
Subjects:	Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2406.03017 [cs.CV]
	(or arXiv:2406.03017v2 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2406.03017

Submission history

From: Jun Liu [view email]
[v1] Wed, 5 Jun 2024 07:32:29 UTC (1,044 KB)
[v2] Thu, 13 Jun 2024 13:14:34 UTC (1,041 KB)
[v3] Mon, 1 Jul 2024 04:36:08 UTC (1,049 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:DifAttack++: Query-Efficient Black-Box Adversarial Attack via Hierarchical Disentangled Feature Space in Cross Domain

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:DifAttack++: Query-Efficient Black-Box Adversarial Attack via Hierarchical Disentangled Feature Space in Cross Domain

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators