Now you're speaking my language: visual language identification

The goal of this work is to train models that can identify a spoken language just by interpreting the speaker’s lip movements. Our contributions are the following: (i) we show that models can learn to discriminate among 14 different languages using only visual speech information; (ii) we compare dif...

Mô tả đầy đủ

Chi tiết về thư mục
Những tác giả chính: Afouras, T, Chung, JS, Zisserman, A
Định dạng: Conference item
Ngôn ngữ:English
Được phát hành: ISCA Archive 2020

Những quyển sách tương tự