Round-Based Mechanism and Job Packing with Model-Similarity-Based Policy for Scheduling DL Training in GPU Cluster

Graphics Processing Units (GPUs) are employed for their parallel processing capabilities, which are essential to train deep learning (DL) models with large datasets within a reasonable time. However, the diverse GPU architectures exhibit variability in training performance depending on DL models. Fu...

Full description

Bibliographic Details
Main Authors:	Panissara Thanapol, Kittichai Lavangnananda, Franck Leprévost, Arnaud Glad, Julien Schleich, Pascal Bouvry
Format:	Article
Language:	English
Published:	MDPI AG 2024-03-01
Series:	Applied Sciences
Subjects:	deep learning deep learning training distributed training GPU cluster job packing round-based mechanism
Online Access:	https://www.mdpi.com/2076-3417/14/6/2349

Internet

https://www.mdpi.com/2076-3417/14/6/2349

Round-Based Mechanism and Job Packing with Model-Similarity-Based Policy for Scheduling DL Training in GPU Cluster

Internet

Similar Items