أرسل هذا في رسالة قصيرة: Rethinking visual prompting for multimodal large language models with external knowledge