FACTIFY3M: A Benchmark for Multimodal Fact Verification with Explainability through 5W Question-Answering

Chakraborty, Megha; Pahwa, Khushbu; Rani, Anku; Chatterjee, Shreyas; Dalal, Dwip; Dave, Harshit; G, Ritvik; Gurumurthy, Preethi; Mahor, Adarsh; Mukherjee, Samahriti; Pakala, Aditya; Paul, Ishan; Reddy, Janvita; Sarkar, Arghya; Sensharma, Kinjal; Chadha, Aman; Sheth, Amit P.; Das, Amitava

Computer Science > Computation and Language

arXiv:2306.05523 (cs)

[Submitted on 22 May 2023 (v1), last revised 31 Oct 2023 (this version, v2)]

Title:FACTIFY3M: A Benchmark for Multimodal Fact Verification with Explainability through 5W Question-Answering

Authors:Megha Chakraborty, Khushbu Pahwa, Anku Rani, Shreyas Chatterjee, Dwip Dalal, Harshit Dave, Ritvik G, Preethi Gurumurthy, Adarsh Mahor, Samahriti Mukherjee, Aditya Pakala, Ishan Paul, Janvita Reddy, Arghya Sarkar, Kinjal Sensharma, Aman Chadha, Amit P. Sheth, Amitava Das

View PDF

Abstract:Combating disinformation is one of the burning societal crises -- about 67% of the American population believes that disinformation produces a lot of uncertainty, and 10% of them knowingly propagate disinformation. Evidence shows that disinformation can manipulate democratic processes and public opinion, causing disruption in the share market, panic and anxiety in society, and even death during crises. Therefore, disinformation should be identified promptly and, if possible, mitigated. With approximately 3.2 billion images and 720,000 hours of video shared online daily on social media platforms, scalable detection of multimodal disinformation requires efficient fact verification. Despite progress in automatic text-based fact verification (e.g., FEVER, LIAR), the research community lacks substantial effort in multimodal fact verification. To address this gap, we introduce FACTIFY 3M, a dataset of 3 million samples that pushes the boundaries of the domain of fact verification via a multimodal fake news dataset, in addition to offering explainability through the concept of 5W question-answering. Salient features of the dataset include: (i) textual claims, (ii) ChatGPT-generated paraphrased claims, (iii) associated images, (iv) stable diffusion-generated additional images (i.e., visual paraphrases), (v) pixel-level image heatmap to foster image-text explainability of the claim, (vi) 5W QA pairs, and (vii) adversarial fake news stories.

Comments:	arXiv admin note: text overlap with arXiv:2305.04329
Subjects:	Computation and Language (cs.CL); Artificial Intelligence (cs.AI); Computer Vision and Pattern Recognition (cs.CV); Multimedia (cs.MM)
Cite as:	arXiv:2306.05523 [cs.CL]
	(or arXiv:2306.05523v2 [cs.CL] for this version)
	https://doi.org/10.48550/arXiv.2306.05523

Submission history

From: Dwip Dalal [view email]
[v1] Mon, 22 May 2023 08:29:47 UTC (9,592 KB)
[v2] Tue, 31 Oct 2023 01:51:56 UTC (9,789 KB)

Computer Science > Computation and Language

Title:FACTIFY3M: A Benchmark for Multimodal Fact Verification with Explainability through 5W Question-Answering

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computation and Language

Title:FACTIFY3M: A Benchmark for Multimodal Fact Verification with Explainability through 5W Question-Answering

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators