Task Indicating Transformer for Task-conditional Dense Predictions

Lu, Yuxiang; Sirejiding, Shalayiding; Bayramli, Bayram; Huang, Suizhi; Ding, Yue; Lu, Hongtao

Computer Science > Computer Vision and Pattern Recognition

arXiv:2403.00327 (cs)

[Submitted on 1 Mar 2024]

Title:Task Indicating Transformer for Task-conditional Dense Predictions

Authors:Yuxiang Lu, Shalayiding Sirejiding, Bayram Bayramli, Suizhi Huang, Yue Ding, Hongtao Lu

View PDF HTML (experimental)

Abstract:The task-conditional model is a distinctive stream for efficient multi-task learning. Existing works encounter a critical limitation in learning task-agnostic and task-specific representations, primarily due to shortcomings in global context modeling arising from CNN-based architectures, as well as a deficiency in multi-scale feature interaction within the decoder. In this paper, we introduce a novel task-conditional framework called Task Indicating Transformer (TIT) to tackle this challenge. Our approach designs a Mix Task Adapter module within the transformer block, which incorporates a Task Indicating Matrix through matrix decomposition, thereby enhancing long-range dependency modeling and parameter-efficient feature adaptation by capturing intra- and inter-task features. Moreover, we propose a Task Gate Decoder module that harnesses a Task Indicating Vector and gating mechanism to facilitate adaptive multi-scale feature refinement guided by task embeddings. Experiments on two public multi-task dense prediction benchmarks, NYUD-v2 and PASCAL-Context, demonstrate that our approach surpasses state-of-the-art task-conditional methods.

Comments:	Accepted by ICASSP 2024
Subjects:	Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2403.00327 [cs.CV]
	(or arXiv:2403.00327v1 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2403.00327

Submission history

From: Yuxiang Lu [view email]
[v1] Fri, 1 Mar 2024 07:06:57 UTC (1,559 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:Task Indicating Transformer for Task-conditional Dense Predictions

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:Task Indicating Transformer for Task-conditional Dense Predictions

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators