Audio-visual modelling in a clinical setting

Audio-visual modelling in a clinical setting

Auditory and visual signals are two primary perception modalities that are usually present together and correlate with each other, not only in natural environments but also in clinical settings. However, audio-visual modelling in the latter case can be more challenging, due to the different sources...

Full description

Bibliographic Details
Main Authors:	Jiao, J, Alsharid, M, Drukker, L, Papageorghiou, AT, Zisserman, A, Noble, JA
Format:	Journal article
Language:	English
Published:	Nature Research 2024

Similar Items

Self-supervised contrastive video-speech representation learning for ultrasound
by: Jiao, J, et al.
Published: (2020)

A picture is worth 1000 words: textual analysis of routine 20-week scan
by: Alsharid, M, et al.
Published: (2022)

Towards scale and position invariant task classification using normalised visual scanpaths in clinical fetal ultrasound
by: Teng, C, et al.
Published: (2021)

Captioning ultrasound images automatically
by: Alsharid, M, et al.
Published: (2019)

Gaze-assisted automatic captioning of fetal ultrasound videos using three-way multi-modal deep neural networks
by: Alsharid, M, et al.
Published: (2022)

A course-focused dual curriculum for image captioning
by: Alsharid, M, et al.
Published: (2021)

A curriculum learning based approach to captioning ultrasound images
by: Alsharid, M, et al.
Published: (2020)

Machine learning-based analysis of operator pupillary response to assess cognitive workload in clinical ultrasound imaging
by: Sharma, H, et al.
Published: (2021)

Multi-modal learning from video, eye tracking, and pupillometry for operator skill characterization in clinical fetal ultrasound
by: Sharma, H, et al.
Published: (2021)

Transforming obstetric ultrasound into data science using eye tracking, voice recording, transducer motion and ultrasound video
by: Drukker, L, et al.
Published: (2021)

Weakly supervised captioning of ultrasound images
by: Alsharid, M, et al.
Published: (2022)

Introduction to artificial intelligence in ultrasound imaging in obstetrics and gynecology
by: Drukker, L, et al.
Published: (2020)

Introduction to artificial intelligence in ultrasound imaging in obstetrics and gynecology
by: Drukker, L, et al.
Published: (2021)

Spatio-temporal visual attention modelling of standard biometry plane-finding navigation
by: Cai, Y, et al.
Published: (2020)

Character-aware audio-visual subtitling in context
by: Huh, J, et al.
Published: (2024)

Anatomy-aware contrastive representation learning for fetal ultrasound
by: Fu, Z, et al.
Published: (2023)

Audio-visual synchronisation in the wild
by: Chen, H, et al.
Published: (2021)

Deep audio-visual speech recognition
by: Afouras, T, et al.
Published: (2018)

The conversation: deep audio-visual speech enhancement
by: Alfouras, T, et al.
Published: (2018)

Skill characterisation of sonographer gaze patterns during second trimester clinical fetal ultrasounds using time curves
by: Teng, C, et al.
Published: (2022)

Ultrasound image representation learning by modeling sonographer visual attention
by: Droste, R, et al.
Published: (2019)

Knowledge representation and learning of operator clinical workflow from full-length routine fetal ultrasound scan videos
by: Sharma, H, et al.
Published: (2021)

Seeing wake words: Audio-visual keyword spotting
by: Momeni, L, et al.
Published: (2020)

Vggsound: a large-scale audio-visual dataset
by: Chen, H, et al.
Published: (2020)

Skill, or style? Classification of fetal sonography eye-tracking data
by: Teng, C, et al.
Published: (2022)

VP18.07: First trimester scans: how much time does it take to acquire the CRL and NT?
by: Drukker, L, et al.
Published: (2021)

Differentiating operator skill during routine fetal ultrasound scanning using probe motion tracking
by: Wang, Y, et al.
Published: (2020)

Towards unsupervised ultrasound video clinical quality assessment with multi-modality data
by: Zhao, H, et al.
Published: (2022)

Look, listen and recognise: character-aware audio-visual subtitling
by: Korbar, B, et al.
Published: (2024)

Automatic probe movement guidance for freehand obstetric ultrasound
by: Droste, R, et al.
Published: (2020)

Visualising spatio-temporal gaze characteristics for exploratory data analysis in clinical fetal ultrasound scans
by: Teng, C, et al.
Published: (2022)

Self-supervised learning of audio-visual objects from video
by: Afouras, T, et al.
Published: (2020)

TIM: a time interval machine for audio-visual action recognition
by: Chalk, J, et al.
Published: (2024)

My lips are concealed: audio-visual speech enhancement through obstructions
by: Afouras, T, et al.
Published: (2019)

Sparse in space and time: audio-visual synchronisation with trainable selectors
by: Iashin, V, et al.
Published: (2022)

Self-knowledge distillation for first trimester ultrasound saliency prediction
by: Gridach, M, et al.
Published: (2022)

Clinical workflow of sonographers performing fetal anomaly ultrasound scans: deep learning-based analysis
by: Drukker, L, et al.
Published: (2022)

Spatial audio and spatial audio-visual learning
by: He, Y
Published: (2024)

The audio-visual handbook: a complete guide to world of audio-visual techniques/
by: 246674 McPherson, Alan, et al.
Published: (1988)

Task model-specific operator skill assessment in routine fetal ultrasound scanning
by: Wang, Y, et al.
Published: (2022)