Multi-Dimensional Optimization for Text Summarization via Reinforcement Learning

Ryu, Sangwon; Do, Heejin; Kim, Yunsu; Lee, Gary Geunbae; Ok, Jungseul

Computer Science > Computation and Language

arXiv:2406.00303 (cs)

[Submitted on 1 Jun 2024]

Title:Multi-Dimensional Optimization for Text Summarization via Reinforcement Learning

Authors:Sangwon Ryu, Heejin Do, Yunsu Kim, Gary Geunbae Lee, Jungseul Ok

View PDF HTML (experimental)

Abstract:The evaluation of summary quality encompasses diverse dimensions such as consistency, coherence, relevance, and fluency. However, existing summarization methods often target a specific dimension, facing challenges in generating well-balanced summaries across multiple dimensions. In this paper, we propose multi-objective reinforcement learning tailored to generate balanced summaries across all four dimensions. We introduce two multi-dimensional optimization (MDO) strategies for adaptive learning: 1) MDO_min, rewarding the current lowest dimension score, and 2) MDO_pro, optimizing multiple dimensions similar to multi-task learning, resolves conflicting gradients across dimensions through gradient projection. Unlike prior ROUGE-based rewards relying on reference summaries, we use a QA-based reward model that aligns with human preferences. Further, we discover the capability to regulate the length of summaries by adjusting the discount factor, seeking the generation of concise yet informative summaries that encapsulate crucial points. Our approach achieved substantial performance gains compared to baseline models on representative summarization datasets, particularly in the overlooked dimensions.

Comments:	ACL 2024
Subjects:	Computation and Language (cs.CL); Artificial Intelligence (cs.AI)
Cite as:	arXiv:2406.00303 [cs.CL]
	(or arXiv:2406.00303v1 [cs.CL] for this version)
	https://doi.org/10.48550/arXiv.2406.00303

Submission history

From: Sangwon Ryu [view email]
[v1] Sat, 1 Jun 2024 05:15:12 UTC (8,718 KB)

Computer Science > Computation and Language

Title:Multi-Dimensional Optimization for Text Summarization via Reinforcement Learning

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computation and Language

Title:Multi-Dimensional Optimization for Text Summarization via Reinforcement Learning

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators