Multimodal fusion: A study on speech-text emotion recognition with the integration of deep learning

Multimodal fusion: A study on speech-text emotion recognition with the integration of deep learning

Recognition of various human emotions holds significant value in numerous real-world scenarios. This paper focuses on the multimodal fusion of speech and text for emotion recognition. A 39-dimensional Mel-frequency cepstral coefficient (MFCC) was used as a feature for speech emotion. A 300-dimension...

Detaylı Bibliyografya
Asıl Yazarlar:	Yanan Shang, Tianqi Fu
Materyal Türü:	Makale
Dil:	English
Baskı/Yayın Bilgisi:	Elsevier 2024-12-01
Seri Bilgileri:	Intelligent Systems with Applications
Konular:	Multimodal fusion Deep learning Glove model BiGRU Emotion recognition
Online Erişim:	http://www.sciencedirect.com/science/article/pii/S2667305324001108

Benzer Materyaller

Emotion recognition and achievement prediction for foreign language learners under the background of network teaching
Yazar:: Yi Ding, ve diğerleri
Baskı/Yayın Bilgisi: (2022-10-01)

Research on Dual-Emotion Feature Fusion and Performance Improvement in Rumor Detection
Yazar:: Wen Jiang, ve diğerleri
Baskı/Yayın Bilgisi: (2024-09-01)

Chinese Mathematical Knowledge Entity Recognition Based on Linguistically Motivated Bidirectional Encoder Representation from Transformers
Yazar:: Wei Song, ve diğerleri
Baskı/Yayın Bilgisi: (2025-01-01)

Named Entity Recognition for Chinese Texts on Marine Coral Reef Ecosystems Based on the BERT-BiGRU-Att-CRF Model
Yazar:: Danfeng Zhao, ve diğerleri
Baskı/Yayın Bilgisi: (2024-07-01)

Microblog Text Emotion Classification Algorithm Based on TCN-BiGRU and Dual Attention
Yazar:: Yao Qin, ve diğerleri
Baskı/Yayın Bilgisi: (2023-02-01)

A Framework to Evaluate Fusion Methods for Multimodal Emotion Recognition
Yazar:: Diego Pena, ve diğerleri
Baskı/Yayın Bilgisi: (2023-01-01)

A Survey of Deep Learning-Based Multimodal Emotion Recognition: Speech, Text, and Face
Yazar:: Hailun Lian, ve diğerleri
Baskı/Yayın Bilgisi: (2023-10-01)

Study on Chinese Semantic Entity Recognition Method for Cabin Utilizing BERT-BiGRU Model
Yazar:: Ruina Ma, ve diğerleri
Baskı/Yayın Bilgisi: (2024-01-01)

Multimodal transformer augmented fusion for speech emotion recognition
Yazar:: Yuanyuan Wang, ve diğerleri
Baskı/Yayın Bilgisi: (2023-05-01)

MPNet-GRUs: Sentiment Analysis With Masked and Permuted Pre-Training for Language Understanding and Gated Recurrent Units
Yazar:: Nicole Kai Ning Loh, ve diğerleri
Baskı/Yayın Bilgisi: (2024-01-01)

Underwater Target Classification Based on Feature Fusion and Gene Encoding of CNN-BIGRU-Attention
Yazar:: Ziyi Feng, ve diğerleri
Baskı/Yayın Bilgisi: (2023-01-01)

A Hybrid Deep Learning Architecture for Social Media Bots Detection Based on BiGRU-LSTM and GloVe Word Embedding
Yazar:: Zineb Ellaky, ve diğerleri
Baskı/Yayın Bilgisi: (2024-01-01)

Summarization of scholarly articles using BERT and BiGRU: Deep learning-based extractive approach
Yazar:: Sheher Bano, ve diğerleri
Baskı/Yayın Bilgisi: (2023-10-01)

A New Network Structure for Speech Emotion Recognition Research
Yazar:: Chunsheng Xu, ve diğerleri
Baskı/Yayın Bilgisi: (2024-02-01)

Recognition of printed Urdu script in Nastaleeq font by using CNN-BiGRU-GRU Based Encoder-Decoder Framework
Yazar:: Sohail Zia, ve diğerleri
Baskı/Yayın Bilgisi: (2023-05-01)

ACG-EmoCluster: A Novel Framework to Capture Spatial and Temporal Information from Emotional Speech Enhanced by DeepCluster
Yazar:: Huan Zhao, ve diğerleri
Baskı/Yayın Bilgisi: (2023-05-01)

Cross-Subject Multimodal Emotion Recognition Based on Hybrid Fusion
Yazar:: Yucel Cimtay, ve diğerleri
Baskı/Yayın Bilgisi: (2020-01-01)

Robust Multimodal Emotion Recognition from Conversation with Transformer-Based Crossmodality Fusion
Yazar:: Baijun Xie, ve diğerleri
Baskı/Yayın Bilgisi: (2021-07-01)

Deep Multimodal Emotion Recognition on Human Speech: A Review
Yazar:: Panagiotis Koromilas, ve diğerleri
Baskı/Yayın Bilgisi: (2021-08-01)

Ship Anomalous Behavior Detection Using Clustering and Deep Recurrent Neural Network
Yazar:: Bohan Zhang, ve diğerleri
Baskı/Yayın Bilgisi: (2023-03-01)

A Novel BiGRU-Attention Model for Predicting Corn Market Prices Based on Multi-Feature Fusion and Grey Wolf Optimization
Yazar:: Yang Feng, ve diğerleri
Baskı/Yayın Bilgisi: (2025-02-01)

A Novel Traffic Classification Approach by Employing Deep Learning on Software-Defined Networking
Yazar:: Daniel Nuñez-Agurto, ve diğerleri
Baskı/Yayın Bilgisi: (2024-04-01)

Text Sentiment Analysis Based on Fusion of Attention Mechanism and BiGRU
Yazar:: YANG Qing, ZHANG Ya-wen, ZHU Li, WU Tao
Baskı/Yayın Bilgisi: (2021-11-01)

Human Action Recognition Based on Improved Two-Stream Convolution Network
Yazar:: Zhongwen Wang, ve diğerleri
Baskı/Yayın Bilgisi: (2022-06-01)

Multi-Label Multimodal Emotion Recognition With Transformer-Based Fusion and Emotion-Level Representation Learning
Yazar:: Hoai-Duy Le, ve diğerleri
Baskı/Yayın Bilgisi: (2023-01-01)

DropBlock based bimodal hybrid neural network for wireless communication modulation recognition
Yazar:: Yan GAO, ve diğerleri
Baskı/Yayın Bilgisi: (2022-05-01)

DropBlock based bimodal hybrid neural network for wireless communication modulation recognition
Yazar:: Yan GAO, ve diğerleri
Baskı/Yayın Bilgisi: (2022-05-01)

Research on Medical Text Parsing Method Based on BiGRU-BiLSTM Multi-Task Learning
Yazar:: Yunli Fan, ve diğerleri
Baskı/Yayın Bilgisi: (2024-11-01)

Dual-Branch Multimodal Fusion Network for Driver Facial Emotion Recognition
Yazar:: Le Wang, ve diğerleri
Baskı/Yayın Bilgisi: (2024-10-01)

Knowledge-oriented Hierarchical Neural Network for sentiment classification
Yazar:: Wang, Yanliu, ve diğerleri
Baskı/Yayın Bilgisi: (2020)

Research on power system fault prediction based on GA-CNN-BiGRU
Yazar:: Daohua Zhang, ve diğerleri
Baskı/Yayın Bilgisi: (2023-08-01)

Longitudinal dependence of the forecast accuracy of the ionospheric total electron content in the equatorial zone
Yazar:: Artem Kharakhashyan, ve diğerleri
Baskı/Yayın Bilgisi: (2024-09-01)

Comparison of the Forecast Accuracy of Total Electron Content for Bidirectional and Temporal Convolutional Neural Networks in European Region
Yazar:: Artem Kharakhashyan, ve diğerleri
Baskı/Yayın Bilgisi: (2023-06-01)

TACFN: Transformer-Based Adaptive Cross-Modal Fusion Network for Multimodal Emotion Recognition
Yazar:: Feng Liu, ve diğerleri
Baskı/Yayın Bilgisi: (2023-12-01)

Multimodal Daily-Life Emotional Recognition Using Heart Rate and Speech Data From Wearables
Yazar:: Eesun Moon, ve diğerleri
Baskı/Yayın Bilgisi: (2024-01-01)

MLHS-CGCapNet: A Lightweight Model for Multilingual Hate Speech Detection
Yazar:: Abida Kousar, ve diğerleri
Baskı/Yayın Bilgisi: (2024-01-01)

Sentiment Analysis for E-Commerce Product Reviews in Chinese Based on Sentiment Lexicon and Deep Learning
Yazar:: Li Yang, ve diğerleri
Baskı/Yayın Bilgisi: (2020-01-01)

A multi-stage fault prediction method of continuous casting machine based on Weibull distribution and deep learning
Yazar:: Erbao Xu, ve diğerleri
Baskı/Yayın Bilgisi: (2023-08-01)

Real-time music emotion recognition based on multimodal fusion
Yazar:: Xingye Hao, ve diğerleri
Baskı/Yayın Bilgisi: (2025-03-01)

Long Text QA Matching Model Based on BiGRU–DAttention–DSSM
Yazar:: Shihong Chen, ve diğerleri
Baskı/Yayın Bilgisi: (2021-05-01)