Multi-modal adaptive gated mechanism for visual question answering.

Visual Question Answering (VQA) is a multimodal task that uses natural language to ask and answer questions based on image content. For multimodal tasks, obtaining accurate modality feature information is crucial. The existing researches on the visual question answering model mainly start from the p...

Full description

Bibliographic Details
Main Authors:	Yangshuyi Xu, Lin Zhang, Xiang Shen
Format:	Article
Language:	English
Published:	Public Library of Science (PLoS) 2023-01-01
Series:	PLoS ONE
Online Access:	https://doi.org/10.1371/journal.pone.0287557

Internet

https://doi.org/10.1371/journal.pone.0287557

Multi-modal adaptive gated mechanism for visual question answering.

Internet

Similar Items