Epic-sounds: a large-scale dataset of actions that sound
We introduce EPIC-SOUNDS, a large-scale dataset of audio annotations capturing temporal extents and class labels within the audio stream of the egocentric videos from EPIC-KITCHENS-100. We propose an annotation pipeline where annotators temporally label distinguishable audio segments and describe th...
Những tác giả chính: | Huh, J, Chalk, J, Kazakos, E, Damen, D, Zisserman, A |
---|---|
Định dạng: | Conference item |
Ngôn ngữ: | English |
Được phát hành: |
IEEE
2023
|
Những quyển sách tương tự
-
TIM: a time interval machine for audio-visual action recognition
Bằng: Chalk, J, et al.
Được phát hành: (2024) -
EPIC-fusion: audio-visual temporal binding for egocentric action recognition
Bằng: Kazakos, E, et al.
Được phát hành: (2020) -
With a little help from my temporal context: multimodal egocentric action recognition
Bằng: Kazakos, E, et al.
Được phát hành: (2021) -
Objects that sound
Bằng: Arandjelović, R, et al.
Được phát hành: (2018) -
Figurative Interpretation of Sound in the Heroic Epic Poetry of Peoples of Siberia
Bằng: Evgeniya Nikolaevna Kuzmina, et al.
Được phát hành: (2022-03-01)