Leveraging Multimodal-LLMs Assisted by Instance Segmentation for Intelligent Traffic Monitoring

Onsu, Murat Arda; Lohan, Poonam; Kantarci, Burak; Syed, Aisha; Andrews, Matthew; Kennedy, Sean

Computer Science > Artificial Intelligence

arXiv:2502.11304 (cs)

[Submitted on 16 Feb 2025]

Title:Leveraging Multimodal-LLMs Assisted by Instance Segmentation for Intelligent Traffic Monitoring

Authors:Murat Arda Onsu, Poonam Lohan, Burak Kantarci, Aisha Syed, Matthew Andrews, Sean Kennedy

View PDF HTML (experimental)

Abstract:A robust and efficient traffic monitoring system is essential for smart cities and Intelligent Transportation Systems (ITS), using sensors and cameras to track vehicle movements, optimize traffic flow, reduce congestion, enhance road safety, and enable real-time adaptive traffic control. Traffic monitoring models must comprehensively understand dynamic urban conditions and provide an intuitive user interface for effective management. This research leverages the LLaVA visual grounding multimodal large language model (LLM) for traffic monitoring tasks on the real-time Quanser Interactive Lab simulation platform, covering scenarios like intersections, congestion, and collisions. Cameras placed at multiple urban locations collect real-time images from the simulation, which are fed into the LLaVA model with queries for analysis. An instance segmentation model integrated into the cameras highlights key elements such as vehicles and pedestrians, enhancing training and throughput. The system achieves 84.3% accuracy in recognizing vehicle locations and 76.4% in determining steering direction, outperforming traditional models.

Comments:	6 pages, 7 figures, submitted to 30th IEEE International Symposium on Computers and Communications (ISCC) 2025
Subjects:	Artificial Intelligence (cs.AI); Computation and Language (cs.CL); Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2502.11304 [cs.AI]
	(or arXiv:2502.11304v1 [cs.AI] for this version)
	https://doi.org/10.48550/arXiv.2502.11304

Submission history

From: Burak Kantarci [view email]
[v1] Sun, 16 Feb 2025 23:03:26 UTC (8,011 KB)

Computer Science > Artificial Intelligence

Title:Leveraging Multimodal-LLMs Assisted by Instance Segmentation for Intelligent Traffic Monitoring

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Artificial Intelligence

Title:Leveraging Multimodal-LLMs Assisted by Instance Segmentation for Intelligent Traffic Monitoring

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators