A GPU Scheduling Framework to Accelerate Hyper-Parameter Optimization in Deep Learning Clusters

A GPU Scheduling Framework to Accelerate Hyper-Parameter Optimization in Deep Learning Clusters

This paper proposes Hermes, a container-based preemptive GPU scheduling framework for accelerating hyper-parameter optimization in deep learning (DL) clusters. Hermes accelerates hyper-parameter optimization by time-sharing between DL jobs and prioritizing jobs with more promising hyper-parameter co...

Full description

Bibliographic Details
Main Authors:	Jaewon Son, Yonghyuk Yoo, Khu-rai Kim, Youngjae Kim, Kwonyong Lee, Sungyong Park
Format:	Article
Language:	English
Published:	MDPI AG 2021-02-01
Series:	Electronics
Subjects:	hyper-parameter optimization deep learning cluster GPU scheduling container
Online Access:	https://www.mdpi.com/2079-9292/10/3/350

Similar Items

A unified schedule policy of distributed machine learning framework for CPU-GPU cluster
Published: (2021-06-01)

Accelerated Diffusion-Based Recommendation Algorithm on Tripartite Graphs with GPU Clusters
by: Jingpeng Wang, et al.
Published: (2016-03-01)

Implementation of the parallel mean shift-based image segmentation algorithm on a GPU cluster
by: Fang Huang, et al.
Published: (2019-03-01)

Multi‐communication layered HPL model and its application to GPU clusters
by: Young Woo Kim, et al.
Published: (2021-06-01)

Beyond Hyper-Heuristics: A Squared Hyper-Heuristic Model for Solving Job Shop Scheduling Problems
by: Alonso Vela, et al.
Published: (2022-01-01)

Graph Processing Scheme Using GPU With Value-Driven Differential Scheduling
by: Sangho Song, et al.
Published: (2024-01-01)

Edge GPU cluster processing system for laser interference image collection
by: Dajun Chang, et al.
Published: (2022-10-01)

Scheduling Framework for Accelerating Multiple Detection-Free Object Trackers
by: Myungsun Kim, et al.
Published: (2023-03-01)

Heterogeneous Gpu&Cpu Cluster For High Performance Computing In Cryptography
by: Michał Marks, et al.
Published: (2012-01-01)

Cost Efficient GPU Cluster Management for Training and Inference of Deep Learning
by: Dong-Ki Kang, et al.
Published: (2022-01-01)

Clustering by Constructing Hyper-Planes
by: Luhong Diao, et al.
Published: (2021-01-01)

GPU accelerated adaptive banded event alignment for rapid comparative nanopore signal analysis
by: Hasindu Gamaarachchi, et al.
Published: (2020-08-01)

Self-balanced Scheduling Strategy for Container Cluster Based on Improved DQN Algorithm
by: XIE Yongsheng, HUANG Xiangheng, CHEN Ningjiang
Published: (2023-04-01)

A Hyper-Heuristic for the Preemptive Single Machine Scheduling Problem to Minimize the Total Weighted Tardiness
by: Romanuke Vadim
Published: (2022-06-01)

GPU ACCELERATION OF DOPPLER BROADENING FOR NEUTRON TRANSPORT CALCULATIONS1
by: Burke Paul E., et al.
Published: (2021-01-01)

GPU Accelerated Processing Method for Feature Point Extraction and Matching in Satellite SAR Images
by: Lei Dong, et al.
Published: (2024-02-01)

Round-Based Mechanism and Job Packing with Model-Similarity-Based Policy for Scheduling DL Training in GPU Cluster
by: Panissara Thanapol, et al.
Published: (2024-03-01)

GPGPU Task Scheduling Technique for Reducing the Performance Deviation of Multiple GPGPU Tasks in RPC-Based GPU Virtualization Environments
by: Jihun Kang, et al.
Published: (2021-03-01)

GPU Hızlandırmalı Veri Demetleme Algoritmalarının İncelenmesi
by: Murat Hacıömeroğlu, et al.
Published: (2013-04-01)

Parallel fuzzy minimals on GPU
by: Aleardo Manacero, et al.
Published: (2022-02-01)

GPU-accelerated raster map reprojection
by: Petr Sloup
Published: (2016-07-01)

GPU Accelerated Variation after Projection Calculation
by: LU Xiao, LIAN Zhanjiang, GAO Zaochun
Published: (2024-02-01)

Turbomachinery GPU Accelerated CFD: An Insight into Performance
by: Daniel Molinero-Hernández, et al.
Published: (2024-03-01)

Accelerating the XGBoost algorithm using GPU computing
by: Rory Mitchell, et al.
Published: (2017-07-01)

CPU–GPU Utilization Aware Energy-Efficient Scheduling Algorithm on Heterogeneous Computing Systems
by: Xiaoyong Tang, et al.
Published: (2020-01-01)

Evaluation of Clustering Algorithms on GPU-Based Edge Computing Platforms
by: José M. Cecilia, et al.
Published: (2020-11-01)

Building Modern GPU Brute-Force Collision Resistible Hash Algorithm
by: L. A. Nadeinsky
Published: (2012-03-01)

A Multi-Objective Hyper-Heuristic Clustering Algorithm for Formulas in Traditional Chinese Medicine
by: Wen Shi, et al.
Published: (2023-01-01)

GPU-Accelerated Interaction-Aware Motion Prediction
by: Juan Luis Hortelano, et al.
Published: (2023-09-01)

A Hyper Heuristic Algorithm Based Genetic Programming for Steel Production Scheduling of Cyber-Physical System-ORIENTED
by: Xiaowu Chen, et al.
Published: (2021-09-01)

Analyzing GCN Aggregation on GPU
by: Inje Kim, et al.
Published: (2022-01-01)

Hybrid CPU-GPU Community Detection in Weighted Networks
by: Stavros Souravlas, et al.
Published: (2020-01-01)

Analyzing Data Locality on GPU Caches Using Static Profiling of Workloads
by: Jieun Kim, et al.
Published: (2023-01-01)

gMSR: A Multi-GPU Algorithm to Accelerate a Massive Validation of Biclusters
by: Aurelio López-Fernández, et al.
Published: (2020-10-01)

GPU Acceleration of a Non-Standard Finite Element Mesh Truncation Technique for Electromagnetics
by: Jose M. Badia, et al.
Published: (2020-01-01)

Design of high‐speed software defined radar with GPU accelerator
by: Wenda Li, et al.
Published: (2022-07-01)

ON STRONGLY ASSOCIATIVE HYPERRINGS
by: Fatemeh Arabpur, et al.
Published: (2019-01-01)

Parallel WMD Algorithm Based on GPU Acceleration
by: HU Rong, YANG Wang-dong, WANG Hao-tian, LUO Hui-zhang, LI Ken-li
Published: (2021-12-01)

Hyper-Heuristic Coevolution of Machine Assignment and Job Sequencing Rules for Multi-Objective Dynamic Flexible Job Shop Scheduling
by: Yong Zhou, et al.
Published: (2019-01-01)

Time-Constrained Adversarial Defense in IoT Edge Devices through Kernel Tensor Decomposition and Multi-DNN Scheduling
by: Myungsun Kim, et al.
Published: (2022-08-01)