Semantics-aware dynamic localization and refinement for referring image segmentation
Referring image segmentation segments an image from a language expression. With the aim of producing high-quality masks, existing methods often adopt iterative learning approaches that rely on RNNs or stacked attention layers to refine vision-language features. Despite their complexity, RNN-based me...
Հիմնական հեղինակներ: | Yang, Z, Wang, J, Tang, Y, Chen, K, Zhao, H, Torr, PHS |
---|---|
Ձևաչափ: | Conference item |
Լեզու: | English |
Հրապարակվել է: |
AAAI Conference on Artificial Intelligence
2023
|
Նմանատիպ նյութեր
-
LAVT: Language-Aware Vision Transformer for referring image segmentation
: Yang, Z, և այլն
Հրապարակվել է: (2022) -
Language-aware vision transformer for referring segmentation
: Yang, Z, և այլն
Հրապարակվել է: (2024) -
Hierarchical interaction network for video object segmentation from referring expressions
: Yang, Z, և այլն
Հրապարակվել է: (2021) -
Scalable cascade inference for semantic image segmentation
: Sturgess, P, և այլն
Հրապարակվել է: (2012) -
Local and blobal GANs with semantic-aware upsampling for image generation
: Tang, H, և այլն
Հրապարակվել է: (2022)