An End-to-End Framework Based on Vision-Language Fusion for Remote Sensing Cross-Modal Text-Image Retrieval

Remote sensing cross-modal text-image retrieval (RSCTIR) has recently attracted extensive attention due to its advantages of fast extraction of remote sensing image information and flexible human–computer interaction. Traditional RSCTIR methods mainly focus on improving the performance of uni-modal...

Full description

Bibliographic Details
Main Authors:	Liu He, Shuyan Liu, Ran An, Yudong Zhuo, Jian Tao
Format:	Article
Language:	English
Published:	MDPI AG 2023-05-01
Series:	Mathematics
Subjects:	remote sensing cross-modal text-image retrieval vision-language fusion multi-modal learning multitask optimization
Online Access:	https://www.mdpi.com/2227-7390/11/10/2279

Internet

https://www.mdpi.com/2227-7390/11/10/2279

An End-to-End Framework Based on Vision-Language Fusion for Remote Sensing Cross-Modal Text-Image Retrieval

Internet

Similar Items