Video understanding using multimodal deep learning

Video understanding using multimodal deep learning

<p>Our experience of the world is multimodal, however deep learning networks have been traditionally designed for and trained on unimodal inputs such as images, audio segments or text. In this thesis we develop strategies to exploit multimodal information (in the form of vision, text, speech a...

Detaylı Bibliyografya
Yazar:	Nagrani, A
Diğer Yazarlar:	Zisserman, A
Materyal Türü:	Tez
Dil:	English
Baskı/Yayın Bilgisi:	2020
Konular:	Computer Vision Machine Learning

Benzer Materyaller

Sign language understanding using multimodal learning
Yazar:: Momeni, L
Baskı/Yayın Bilgisi: (2024)

Understanding Multimodal Popularity Prediction of Social Media Videos With Self-Attention
Yazar:: Adam Bielski, ve diğerleri
Baskı/Yayın Bilgisi: (2018-01-01)

End-to-end learning, and audio-visual human-centric video understanding
Yazar:: Brown, A
Baskı/Yayın Bilgisi: (2022)

Holistic image understanding with deep learning and dense random fields
Yazar:: Zheng, S
Baskı/Yayın Bilgisi: (2016)

Learning with multimodal self-supervision
Yazar:: Chen, H
Baskı/Yayın Bilgisi: (2021)

Self-supervised video representation learning
Yazar:: Han, T
Baskı/Yayın Bilgisi: (2022)

Self-supervised and cross-modal learning from videos
Yazar:: Koepke, AS
Baskı/Yayın Bilgisi: (2019)

Deep vision for indoor understanding and localisation
Yazar:: Howard-Jenkins, H
Baskı/Yayın Bilgisi: (2022)

Understanding video through the lens of language
Yazar:: Bain, M
Baskı/Yayın Bilgisi: (2023)

Pixel-level scene understanding with deep structured models
Yazar:: Arnab, A
Baskı/Yayın Bilgisi: (2019)

Deep Vision Multimodal Learning: Methodology, Benchmark, and Trend
Yazar:: Wenhao Chai, ve diğerleri
Baskı/Yayın Bilgisi: (2022-06-01)

Looking deep at people: towards understanding and generating humans in images with deep learning
Yazar:: de Bem, RA
Baskı/Yayın Bilgisi: (2018)

Learning to understand large-scale 3D point clouds
Yazar:: Qingyong, H
Baskı/Yayın Bilgisi: (2022)

Self-supervised learning using motion and visualizing convolutional neural networks
Yazar:: Mahendran, A
Baskı/Yayın Bilgisi: (2018)

Visual recognition in art using machine learning
Yazar:: Crowley, E
Baskı/Yayın Bilgisi: (2017)

DEEP LEARNING-BASED MODEL FOR CLASSIFICATION OF BEAN NITROGEN STATUS USING DIGITAL CANOPY IMAGING
Yazar:: Murilo M. Baesso, ve diğerleri
Baskı/Yayın Bilgisi: (2023-06-01)

Seeing What You’re Told: Sentence-Guided Activity Recognition In Video
Yazar:: Siddharth, Narayanaswamy, ve diğerleri
Baskı/Yayın Bilgisi: (2015)

An Interpretable Deep Learning-Based Feature Reduction in Video-Based Human Activity Recognition
Yazar:: Micheal Dutt, ve diğerleri
Baskı/Yayın Bilgisi: (2024-01-01)

A Survey on Audio-Video Based Defect Detection Through Deep Learning in Railway Maintenance
Yazar:: Lorenzo De Donato, ve diğerleri
Baskı/Yayın Bilgisi: (2022-01-01)

On the Generalization of Deep Learning Models in Video Deepfake Detection
Yazar:: Davide Alessandro Coccomini, ve diğerleri
Baskı/Yayın Bilgisi: (2023-04-01)

Automatic Detection for Acromegaly Using Hand Photographs: A Deep-Learning Approach
Yazar:: Chengbin Duan, ve diğerleri
Baskı/Yayın Bilgisi: (2021-01-01)

HyMNet: A Multimodal Deep Learning System for Hypertension Prediction Using Fundus Images and Cardiometabolic Risk Factors
Yazar:: Mohammed Baharoon, ve diğerleri
Baskı/Yayın Bilgisi: (2024-10-01)

Corrigendum: Deep Plant Phenomics: A Deep Learning Platform for Complex Plant Phenotyping Tasks
Yazar:: Jordan R. Ubbens, ve diğerleri
Baskı/Yayın Bilgisi: (2018-01-01)

Scalable learning for expanding robot vision
Yazar:: Porav, H
Baskı/Yayın Bilgisi: (2020)

Robust 2D and 3D registration with deep neural networks
Yazar:: Wang, Z
Baskı/Yayın Bilgisi: (2024)

Learning shape from images
Yazar:: Wiles, O
Baskı/Yayın Bilgisi: (2020)

Unsupervised learning of clutter-resistant visual representations from natural videos
Yazar:: Liao, Qianli, ve diğerleri
Baskı/Yayın Bilgisi: (2015)

Challenges and Applications for Implementing Machine Learning in Computer Vision /
Yazar:: Kashyap, Ramgopal, 1984- editor., ve diğerleri
Baskı/Yayın Bilgisi: ([202)

Understanding Mixup Training Methods
Yazar:: Daojun Liang, ve diğerleri
Baskı/Yayın Bilgisi: (2018-01-01)

Multimodal Image-Based Indoor Localization with Machine Learning—A Systematic Review
Yazar:: Szymon Łukasik, ve diğerleri
Baskı/Yayın Bilgisi: (2024-09-01)

Structured learning and prediction in computer vision /
Yazar:: 525432 Nowozin, Sebastian, ve diğerleri
Baskı/Yayın Bilgisi: (2011)

A Dataset of apical periodontitis lesions in panoramic radiographs for deep-learning-based classification and detection
Yazar:: Hoang Viet Do, ve diğerleri
Baskı/Yayın Bilgisi: (2024-06-01)

Use and examination of convolutional neural networks for scene understanding
Yazar:: Jetley, S
Baskı/Yayın Bilgisi: (2018)

Deep Learning Architecture Reduction for fMRI Data
Yazar:: Ruben Alvarez-Gonzalez, ve diğerleri
Baskı/Yayın Bilgisi: (2022-02-01)

Unsupervised learning of 3d objects in the wild
Yazar:: Wu, S
Baskı/Yayın Bilgisi: (2022)

Deep learning based computer vision approaches for smart agricultural applications
Yazar:: V.G. Dhanya, ve diğerleri
Baskı/Yayın Bilgisi: (2022-01-01)

Classification of protected grassland habitats using deep learning architectures on Sentinel-2 satellite imagery data
Yazar:: Gabriel Díaz-Ireland, ve diğerleri
Baskı/Yayın Bilgisi: (2024-11-01)

Computer vision and machine learning with RGB-D sensors /
Yazar:: Shao, Ling
Baskı/Yayın Bilgisi: (c201)

Multimodal Deep Learning Integration of Image, Weather, and Phenotypic Data Under Temporal Effects for Early Prediction of Maize Yield
Yazar:: Danial Shamsuddin, ve diğerleri
Baskı/Yayın Bilgisi: (2024-10-01)

Weakly-supervised learning for video understanding
Yazar:: Deng, Dingfan
Baskı/Yayın Bilgisi: (2023)