أرسل هذا في رسالة قصيرة: Integrated visual transformer and flash attention for lip-to-speech generation GAN