Agent models: Internalizing Chain-of-Action Generation into Reasoning models

Zhang, Yuxiang; Yang, Yuqi; Shu, Jiangming; Wen, Xinyan; Sang, Jitao

Computer Science > Artificial Intelligence

arXiv:2503.06580 (cs)

[Submitted on 9 Mar 2025]

Title:Agent models: Internalizing Chain-of-Action Generation into Reasoning models

Authors:Yuxiang Zhang, Yuqi Yang, Jiangming Shu, Xinyan Wen, Jitao Sang

View PDF HTML (experimental)

Abstract:Traditional agentic workflows rely on external prompts to manage interactions with tools and the environment, which limits the autonomy of reasoning models. We position \emph{Large Agent Models (LAMs)} that internalize the generation of \emph{Chain-of-Action (CoA)}, enabling the model to autonomously decide when and how to use external tools. Our proposed AutoCoA framework combines supervised fine-tuning (SFT) and reinforcement learning (RL), allowing the model to seamlessly switch between reasoning and action while efficiently managing environment interactions. Main components include step-level action triggering, trajectory-level CoA optimization, and an internal world model to reduce real-environment interaction costs. Evaluations on open-domain QA tasks demonstrate that AutoCoA-trained agent models significantly outperform ReAct-based workflows in task completion, especially in tasks that require long-term reasoning and multi-step actions. Code and dataset are available at this https URL

Subjects:	Artificial Intelligence (cs.AI)
Cite as:	arXiv:2503.06580 [cs.AI]
	(or arXiv:2503.06580v1 [cs.AI] for this version)
	https://doi.org/10.48550/arXiv.2503.06580

Submission history

From: Yuxiang Zhang [view email]
[v1] Sun, 9 Mar 2025 12:19:47 UTC (1,336 KB)

Computer Science > Artificial Intelligence

Title:Agent models: Internalizing Chain-of-Action Generation into Reasoning models

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Artificial Intelligence

Title:Agent models: Internalizing Chain-of-Action Generation into Reasoning models

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators