Rethinking visual prompting for multimodal large language models with external knowledge

Rethinking visual prompting for multimodal large language models with external knowledge

In recent years, multimodal large language models (MLLMs) have made significant strides by training on vast high-quality image-text datasets, enabling them to generally understand images well. However, the inherent difficulty in explicitly conveying fine-grained or spatially dense information in tex...

Detaylı Bibliyografya
Asıl Yazarlar:	Lin, Y, Li, Y, Chen, D, Xu, W, Clark, R, Torr, P, Yuan, L
Materyal Türü:	Internet publication
Dil:	English
Baskı/Yayın Bilgisi:	2024

Benzer Materyaller

Prompting Large Language Models with Knowledge-Injection for Knowledge-Based Visual Question Answering
Yazar:: Zhongjian Hu, ve diğerleri
Baskı/Yayın Bilgisi: (2024-09-01)

Knowledge graph construction for heart failure using large language models with prompt engineering
Yazar:: Tianhan Xu, ve diğerleri
Baskı/Yayın Bilgisi: (2024-07-01)

Prompt Optimization in Large Language Models
Yazar:: Antonio Sabbatella, ve diğerleri
Baskı/Yayın Bilgisi: (2024-03-01)

CAT: enhancing multimodal large language model to answer questions in dynamic audio-visual scenarios
Yazar:: Ye, Q, ve diğerleri
Baskı/Yayın Bilgisi: (2024)

Review of large vision models and visual prompt engineering
Yazar:: Jiaqi Wang, ve diğerleri
Baskı/Yayın Bilgisi: (2023-11-01)

A unified prompt-based framework for few-shot multimodal language analysis
Yazar:: Xiaohan Zhang, ve diğerleri
Baskı/Yayın Bilgisi: (2025-06-01)

Learning visual prompts for guiding the attention of vision transformers
Yazar:: Rezaei, R, ve diğerleri
Baskı/Yayın Bilgisi: (2024)

REKP: Refined External Knowledge into Prompt-Tuning for Few-Shot Text Classification
Yazar:: Yuzhuo Dang, ve diğerleri
Baskı/Yayın Bilgisi: (2023-11-01)

Improving language model predictions via prompts enriched with knowledge graphs
Yazar:: Brate, R, ve diğerleri
Baskı/Yayın Bilgisi: (2023)

Aligning, autoencoding and prompting large language models for novel disease reporting
Yazar:: Liu, F, ve diğerleri
Baskı/Yayın Bilgisi: (2025)

uCAP: an unsupervised prompting method for vision-language models
Yazar:: Nguyen, AT, ve diğerleri
Baskı/Yayın Bilgisi: (2024)

Predictive Prompts with Joint Training of Large Language Models for Explainable Recommendation
Yazar:: Ching-Sheng Lin, ve diğerleri
Baskı/Yayın Bilgisi: (2023-10-01)

Extracting Fruit Disease Knowledge from Research Papers Based on Large Language Models and Prompt Engineering
Yazar:: Yunqiao Fei, ve diğerleri
Baskı/Yayın Bilgisi: (2025-01-01)

Balancing Privacy and Robustness in Prompt Learning for Large Language Models
Yazar:: Chiyu Shi, ve diğerleri
Baskı/Yayın Bilgisi: (2024-10-01)

Response Generated by Large Language Models Depends on the Structure of the Prompt
Yazar:: Pradosh Kumar Sarangi, ve diğerleri
Baskı/Yayın Bilgisi: (2024-07-01)

Prompt Engineering: Guiding the Way to Effective Large Language Models
Yazar:: Mohammad Aljanabi, ve diğerleri
Baskı/Yayın Bilgisi: (2023-11-01)

An image is worth 1000 lies: adversarial transferability across prompts on vision-language models
Yazar:: Luo, H, ve diğerleri
Baskı/Yayın Bilgisi: (2024)

A Brief Overview of Few-Shot Prompting in the Large Language Models
Yazar:: Vladlen Kulikov, ve diğerleri
Baskı/Yayın Bilgisi: (2023-05-01)

Diagnostic reasoning prompts reveal the potential for large language model interpretability in medicine
Yazar:: Thomas Savage, ve diğerleri
Baskı/Yayın Bilgisi: (2024-01-01)

The application of multimodal large language models in medicine
Yazar:: Jianing Qiu, ve diğerleri
Baskı/Yayın Bilgisi: (2024-04-01)

Clinical prompt learning with frozen language models
Yazar:: Taylor, N, ve diğerleri
Baskı/Yayın Bilgisi: (2023)

LLMR: Real-time Prompting of Interactive Worlds using Large Language Models
Yazar:: De La Torre, Fernanda, ve diğerleri
Baskı/Yayın Bilgisi: (2024)

Large language model enhanced with prompt-based vanilla distillation for sentence embeddings
Yazar:: Wang, Minghao
Baskı/Yayın Bilgisi: (2024)

Large multimodal models for visual reasoning
Yazar:: Duong, Ngoc Yen
Baskı/Yayın Bilgisi: (2024)

Intelligent extraction of reservoir dispatching information integrating large language model and structured prompts
Yazar:: Yangrui Yang, ve diğerleri
Baskı/Yayın Bilgisi: (2024-06-01)

A Security Risk Taxonomy for Prompt-Based Interaction With Large Language Models
Yazar:: Erik Derner, ve diğerleri
Baskı/Yayın Bilgisi: (2024-01-01)

DetToolChain: a new prompting paradigm to unleash detection ability of MLLM
Yazar:: Wu, Y, ve diğerleri
Baskı/Yayın Bilgisi: (2024)

Research and application of defense mechanism for prompt injection attack of large language model in financial industry
Yazar:: MOU Daen, ve diğerleri
Baskı/Yayın Bilgisi: (2024-10-01)

A medical multimodal large language model for future pandemics
Yazar:: Liu, F, ve diğerleri
Baskı/Yayın Bilgisi: (2023)

On the legal implications of Large Language Model answers: A prompt engineering approach and a view beyond by exploiting Knowledge Graphs
Yazar:: George Hannah, ve diğerleri
Baskı/Yayın Bilgisi: (2025-01-01)

Rethinking Language
Yazar:: Gastor Mapunda, ve diğerleri
Baskı/Yayın Bilgisi: (2024-09-01)

Do Language Models Enjoy Their Own Stories? Prompting Large Language Models for Automatic Story Evaluation
Yazar:: Cyril Chhun, ve diğerleri
Baskı/Yayın Bilgisi: (2024-09-01)

Harnessing multimodal large language models for traffic knowledge graph generation and decision-making
Yazar:: Senyun Kuang, ve diğerleri
Baskı/Yayın Bilgisi: (2024-12-01)

PromptSMILES: prompting for scaffold decoration and fragment linking in chemical language models
Yazar:: Morgan Thomas, ve diğerleri
Baskı/Yayın Bilgisi: (2024-07-01)

The influence of knowledge visualization on externalizing tacit knowledge
Yazar:: Ahmad, Khairul Bariah, ve diğerleri
Baskı/Yayın Bilgisi: (2011)

Rethinking of Coase Theorem: Externalities and Uncertainty
Yazar:: Evgeny A. Kuzmin, ve diğerleri
Baskı/Yayın Bilgisi: (2015-10-01)

Rethinking of Coase Theorem: Externalities and Uncertainty
Yazar:: Evgeny A. Kuzmin, ve diğerleri
Baskı/Yayın Bilgisi: (2015-10-01)

Rethinking of Coase Theorem: Externalities and Uncertainty
Yazar:: Evgeny A. Kuzmin, ve diğerleri
Baskı/Yayın Bilgisi: (2015-10-01)

Rethinking of Coase Theorem: Externalities and Uncertainty
Yazar:: Evgeny A. Kuzmin, ve diğerleri
Baskı/Yayın Bilgisi: (2015-12-01)

TEACHING ENGLISH AS A FOREIGN LANGUAGE: RETHINKING THE MULTIMODALITY AND COMMUNICATION SKILLS IN THE 21st CENTURY
Yazar:: Liudmyla Byrkun
Baskı/Yayın Bilgisi: (2023-12-01)