End-to-end learning, and audio-visual human-centric video understanding
<p>The field of machine learning has seen tremendous progress in the last decade, largely due to the advent of deep neural networks. When trained on large-scale labelled datasets, these machine learning algorithms can learn powerful semantic representations directly from the input data, end-to...
প্রধান লেখক: | Brown, A |
---|---|
অন্যান্য লেখক: | Zisserman, A |
বিন্যাস: | গবেষণাপত্র |
ভাষা: | English |
প্রকাশিত: |
2022
|
বিষয়গুলি: |
অনুরূপ উপাদানগুলি
অনুরূপ উপাদানগুলি
-
Sign language understanding using multimodal learning
অনুযায়ী: Momeni, L
প্রকাশিত: (2024) -
Video understanding using multimodal deep learning
অনুযায়ী: Nagrani, A
প্রকাশিত: (2020) -
Deep vision for indoor understanding and localisation
অনুযায়ী: Howard-Jenkins, H
প্রকাশিত: (2022) -
END TO END LEARNING FOR A DRIVING SIMULATOR
অনুযায়ী: V. F. Alexeev, অন্যান্য
প্রকাশিত: (2019-06-01) -
Self-Supervised Learning for Audio-Visual Relationships of Videos With Stereo Sounds
অনুযায়ী: Tomoya Sato, অন্যান্য
প্রকাশিত: (2022-01-01)