Rethinking visual prompting for multimodal large language models with external knowledge

Rethinking visual prompting for multimodal large language models with external knowledge

In recent years, multimodal large language models (MLLMs) have made significant strides by training on vast high-quality image-text datasets, enabling them to generally understand images well. However, the inherent difficulty in explicitly conveying fine-grained or spatially dense information in tex...

সম্পূর্ণ বিবরণ

গ্রন্থ-পঞ্জীর বিবরন
প্রধান লেখক:	Lin, Y, Li, Y, Chen, D, Xu, W, Clark, R, Torr, P, Yuan, L
বিন্যাস:	Internet publication
ভাষা:	English
প্রকাশিত:	2024

অনুরূপ উপাদানগুলি

Prompting Large Language Models with Knowledge-Injection for Knowledge-Based Visual Question Answering
অনুযায়ী: Zhongjian Hu, অন্যান্য
প্রকাশিত: (2024-09-01)

Knowledge graph construction for heart failure using large language models with prompt engineering
অনুযায়ী: Tianhan Xu, অন্যান্য
প্রকাশিত: (2024-07-01)

Prompt Optimization in Large Language Models
অনুযায়ী: Antonio Sabbatella, অন্যান্য
প্রকাশিত: (2024-03-01)

CAT: enhancing multimodal large language model to answer questions in dynamic audio-visual scenarios
অনুযায়ী: Ye, Q, অন্যান্য
প্রকাশিত: (2024)

Review of large vision models and visual prompt engineering
অনুযায়ী: Jiaqi Wang, অন্যান্য
প্রকাশিত: (2023-11-01)

A unified prompt-based framework for few-shot multimodal language analysis
অনুযায়ী: Xiaohan Zhang, অন্যান্য
প্রকাশিত: (2025-06-01)

Learning visual prompts for guiding the attention of vision transformers
অনুযায়ী: Rezaei, R, অন্যান্য
প্রকাশিত: (2024)

REKP: Refined External Knowledge into Prompt-Tuning for Few-Shot Text Classification
অনুযায়ী: Yuzhuo Dang, অন্যান্য
প্রকাশিত: (2023-11-01)

Improving language model predictions via prompts enriched with knowledge graphs
অনুযায়ী: Brate, R, অন্যান্য
প্রকাশিত: (2023)

Aligning, autoencoding and prompting large language models for novel disease reporting
অনুযায়ী: Liu, F, অন্যান্য
প্রকাশিত: (2025)

uCAP: an unsupervised prompting method for vision-language models
অনুযায়ী: Nguyen, AT, অন্যান্য
প্রকাশিত: (2024)

Predictive Prompts with Joint Training of Large Language Models for Explainable Recommendation
অনুযায়ী: Ching-Sheng Lin, অন্যান্য
প্রকাশিত: (2023-10-01)

Extracting Fruit Disease Knowledge from Research Papers Based on Large Language Models and Prompt Engineering
অনুযায়ী: Yunqiao Fei, অন্যান্য
প্রকাশিত: (2025-01-01)

Balancing Privacy and Robustness in Prompt Learning for Large Language Models
অনুযায়ী: Chiyu Shi, অন্যান্য
প্রকাশিত: (2024-10-01)

Response Generated by Large Language Models Depends on the Structure of the Prompt
অনুযায়ী: Pradosh Kumar Sarangi, অন্যান্য
প্রকাশিত: (2024-07-01)

Prompt Engineering: Guiding the Way to Effective Large Language Models
অনুযায়ী: Mohammad Aljanabi, অন্যান্য
প্রকাশিত: (2023-11-01)

An image is worth 1000 lies: adversarial transferability across prompts on vision-language models
অনুযায়ী: Luo, H, অন্যান্য
প্রকাশিত: (2024)

A Brief Overview of Few-Shot Prompting in the Large Language Models
অনুযায়ী: Vladlen Kulikov, অন্যান্য
প্রকাশিত: (2023-05-01)

Diagnostic reasoning prompts reveal the potential for large language model interpretability in medicine
অনুযায়ী: Thomas Savage, অন্যান্য
প্রকাশিত: (2024-01-01)

The application of multimodal large language models in medicine
অনুযায়ী: Jianing Qiu, অন্যান্য
প্রকাশিত: (2024-04-01)

Clinical prompt learning with frozen language models
অনুযায়ী: Taylor, N, অন্যান্য
প্রকাশিত: (2023)

LLMR: Real-time Prompting of Interactive Worlds using Large Language Models
অনুযায়ী: De La Torre, Fernanda, অন্যান্য
প্রকাশিত: (2024)

Large language model enhanced with prompt-based vanilla distillation for sentence embeddings
অনুযায়ী: Wang, Minghao
প্রকাশিত: (2024)

Large multimodal models for visual reasoning
অনুযায়ী: Duong, Ngoc Yen
প্রকাশিত: (2024)

Intelligent extraction of reservoir dispatching information integrating large language model and structured prompts
অনুযায়ী: Yangrui Yang, অন্যান্য
প্রকাশিত: (2024-06-01)

A Security Risk Taxonomy for Prompt-Based Interaction With Large Language Models
অনুযায়ী: Erik Derner, অন্যান্য
প্রকাশিত: (2024-01-01)

DetToolChain: a new prompting paradigm to unleash detection ability of MLLM
অনুযায়ী: Wu, Y, অন্যান্য
প্রকাশিত: (2024)

Research and application of defense mechanism for prompt injection attack of large language model in financial industry
অনুযায়ী: MOU Daen, অন্যান্য
প্রকাশিত: (2024-10-01)

A medical multimodal large language model for future pandemics
অনুযায়ী: Liu, F, অন্যান্য
প্রকাশিত: (2023)

On the legal implications of Large Language Model answers: A prompt engineering approach and a view beyond by exploiting Knowledge Graphs
অনুযায়ী: George Hannah, অন্যান্য
প্রকাশিত: (2025-01-01)

Rethinking Language
অনুযায়ী: Gastor Mapunda, অন্যান্য
প্রকাশিত: (2024-09-01)

Do Language Models Enjoy Their Own Stories? Prompting Large Language Models for Automatic Story Evaluation
অনুযায়ী: Cyril Chhun, অন্যান্য
প্রকাশিত: (2024-09-01)

Harnessing multimodal large language models for traffic knowledge graph generation and decision-making
অনুযায়ী: Senyun Kuang, অন্যান্য
প্রকাশিত: (2024-12-01)

PromptSMILES: prompting for scaffold decoration and fragment linking in chemical language models
অনুযায়ী: Morgan Thomas, অন্যান্য
প্রকাশিত: (2024-07-01)

The influence of knowledge visualization on externalizing tacit knowledge
অনুযায়ী: Ahmad, Khairul Bariah, অন্যান্য
প্রকাশিত: (2011)

Rethinking of Coase Theorem: Externalities and Uncertainty
অনুযায়ী: Evgeny A. Kuzmin, অন্যান্য
প্রকাশিত: (2015-10-01)

Rethinking of Coase Theorem: Externalities and Uncertainty
অনুযায়ী: Evgeny A. Kuzmin, অন্যান্য
প্রকাশিত: (2015-10-01)

Rethinking of Coase Theorem: Externalities and Uncertainty
অনুযায়ী: Evgeny A. Kuzmin, অন্যান্য
প্রকাশিত: (2015-10-01)

Rethinking of Coase Theorem: Externalities and Uncertainty
অনুযায়ী: Evgeny A. Kuzmin, অন্যান্য
প্রকাশিত: (2015-12-01)

TEACHING ENGLISH AS A FOREIGN LANGUAGE: RETHINKING THE MULTIMODALITY AND COMMUNICATION SKILLS IN THE 21st CENTURY
অনুযায়ী: Liudmyla Byrkun
প্রকাশিত: (2023-12-01)