PROFIT: A Specialized Optimizer for Deep Fine Tuning

Chakravarthy, Anirudh S; Zheng, Shuai Kyle; Huang, Xin; Hemachandra, Sachithra; Zhang, Xiao; Chai, Yuning; Chen, Zhao

Computer Science > Computer Vision and Pattern Recognition

arXiv:2412.01930 (cs)

[Submitted on 2 Dec 2024 (v1), last revised 9 Dec 2024 (this version, v2)]

Title:PROFIT: A Specialized Optimizer for Deep Fine Tuning

Authors:Anirudh S Chakravarthy, Shuai Kyle Zheng, Xin Huang, Sachithra Hemachandra, Xiao Zhang, Yuning Chai, Zhao Chen

View PDF HTML (experimental)

Abstract:Fine-tuning pre-trained models has become invaluable in computer vision and robotics. Recent fine-tuning approaches focus on improving efficiency rather than accuracy by using a mixture of smaller learning rates or frozen backbones. To return the spotlight to model accuracy, we present PROFIT (Proximally Restricted Optimizer For Iterative Training), one of the first optimizers specifically designed for incrementally fine-tuning converged models on new tasks or datasets. Unlike traditional optimizers such as SGD or Adam, which make minimal assumptions due to random initialization, PROFIT leverages the structure of a converged model to regularize the optimization process, leading to improved results. By employing a simple temporal gradient orthogonalization process, PROFIT outperforms traditional fine-tuning methods across various tasks: image classification, representation learning, and large-scale motion prediction. Moreover, PROFIT is encapsulated within the optimizer logic, making it easily integrated into any training pipeline with minimal engineering effort. A new class of fine-tuning optimizers like PROFIT can drive advancements as fine-tuning and incremental training become increasingly prevalent, reducing reliance on costly model training from scratch.

Comments:	technical report
Subjects:	Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2412.01930 [cs.CV]
	(or arXiv:2412.01930v2 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2412.01930

Submission history

From: Shuai Zheng [view email]
[v1] Mon, 2 Dec 2024 19:37:34 UTC (2,172 KB)
[v2] Mon, 9 Dec 2024 06:03:19 UTC (2,172 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:PROFIT: A Specialized Optimizer for Deep Fine Tuning

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:PROFIT: A Specialized Optimizer for Deep Fine Tuning

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators