Damped Newton Stochastic Gradient Descent Method for Neural Networks Training

Damped Newton Stochastic Gradient Descent Method for Neural Networks Training

First-order methods such as stochastic gradient descent (SGD) have recently become popular optimization methods to train deep neural networks (DNNs) for good generalization; however, they need a long training time. Second-order methods which can lower the training time are scarcely used on account o...

Descripció completa

Dades bibliogràfiques
Autors principals:	Jingcheng Zhou, Wei Wei, Ruizhi Zhang, Zhiming Zheng
Format:	Article
Idioma:	English
Publicat:	MDPI AG 2021-06-01
Col·lecció:	Mathematics
Matèries:	stochastic gradient descent damped Newton convexity
Accés en línia:	https://www.mdpi.com/2227-7390/9/13/1533

Ítems similars

Adaptive Stochastic Gradient Descent Method for Convex and Non-Convex Optimization
per: Ruijuan Chen, et al.
Publicat: (2022-11-01)

The Improved Stochastic Fractional Order Gradient Descent Algorithm
per: Yang Yang, et al.
Publicat: (2023-08-01)

Recent Advances in Stochastic Gradient Descent in Deep Learning
per: Yingjie Tian, et al.
Publicat: (2023-01-01)

A Geometric Interpretation of Stochastic Gradient Descent Using Diffusion Metrics
per: Rita Fioresi, et al.
Publicat: (2020-01-01)

Stochastic gradient descent with random label noises: doubly stochastic models and inference stabilizer
per: Haoyi Xiong, et al.
Publicat: (2024-01-01)

Distributed Stochastic Gradient Descent With Compressed and Skipped Communication
per: Tran Thi Phuong, et al.
Publicat: (2023-01-01)

Modified‎ ‎Step‎ ‎Size‎ ‎for‎ ‎Enhanced‎ ‎Stochastic Gradient Descent‎: ‎Convergence and Experiments
per: Mahsa Soheil shamaee, et al.
Publicat: (2024-09-01)

Pipelined Stochastic Gradient Descent with Taylor Expansion
per: Bongwon Jang, et al.
Publicat: (2023-10-01)

A Novel Sine Step Size for Warm-Restart Stochastic Gradient Descent
per: Mahsa Soheil Shamaee, et al.
Publicat: (2024-12-01)

Mutual Information Based Learning Rate Decay for Stochastic Gradient Descent Training of Deep Neural Networks
per: Shrihari Vasudevan
Publicat: (2020-05-01)

Adaptive Gradient Estimation Stochastic Parallel Gradient Descent Algorithm for Laser Beam Cleanup
per: Shiqing Ma, et al.
Publicat: (2021-05-01)

Smoothing gradient descent algorithm for the composite sparse optimization
per: Wei Yang, et al.
Publicat: (2024-11-01)

Stochastic Gradient Descent for Kernel-Based Maximum Correntropy Criterion
per: Tiankai Li, et al.
Publicat: (2024-12-01)

Design of Momentum Fractional Stochastic Gradient Descent for Recommender Systems
per: Zeshan Aslam Khan, et al.
Publicat: (2019-01-01)

Adaptive Stochastic Conjugate Gradient Optimization for Backpropagation Neural Networks
per: Ibrahim Abaker Targio Hashem, et al.
Publicat: (2024-01-01)

Counterexamples for Noise Models of Stochastic Gradients
per: Vivak Patel
Publicat: (2023-12-01)

Fast Iterative Hybrid Precoding and Combining With Momentum Gradient Descent and Newton’s Method for Millimeter Wave MIMO Systems
per: Mohamed Alouzi, et al.
Publicat: (2023-01-01)

Public Security Video Surveillance Image Restoration Based on Stochastic Gradient Descent Algorithm
per: Yuxiao MENG, et al.
Publicat: (2022-11-01)

Accelerated Singular Value Decomposition (ASVD) using momentum based Gradient Descent Optimization
per: Sandeep Kumar Raghuwanshi, et al.
Publicat: (2021-05-01)

Determination of accelerated factors in gradient descent iterations based on Taylor's series
per: Petrović Milena, et al.
Publicat: (2017-01-01)

Semi-Stochastic Gradient Descent Methods
per: Jakub Konečný, et al.
Publicat: (2017-05-01)

Estimation of simultaneous equation models by backpropagation method using stochastic gradient descent
per: Belén Pérez-Sánchez, et al.
Publicat: (2024-10-01)

Performance Evaluation of Gradient Descent Optimizers in Estuarine Turbidity Estimation with Multilayer Perceptron and Sentinel-2 Imagery
per: Naledzani Ndou, et al.
Publicat: (2024-10-01)

Stochastic gradient descent algorithm preserving differential privacy in MapReduce framework
per: Yihan YU, et al.
Publicat: (2018-01-01)

Stochastic gradient descent algorithm preserving differential privacy in MapReduce framework
per: Yihan YU, et al.
Publicat: (2018-01-01)

A Method for Transforming Non-Convex Optimization Problem to Distributed Form
per: Oleg O. Khamisov, et al.
Publicat: (2024-09-01)

Newton's method in the context of gradients
per: John W. Neuberger, et al.
Publicat: (2007-09-01)

Hybrid Distributed Optimization for Learning Over Networks With Heterogeneous Agents
per: Mohammad H. Nassralla, et al.
Publicat: (2023-01-01)

On some stochastic mirror descent methods for constrained online optimization problems
per: Mohammad S. Alkousa
Publicat: (2019-04-01)

Gradient Descent Batch Clustering for Image Classification
per: Jae-Sam Park
Publicat: (2023-07-01)

Adaptive Human–Machine Evaluation Framework Using Stochastic Gradient Descent-Based Reinforcement Learning for Dynamic Competing Network
per: Jinbae Kim, et al.
Publicat: (2020-04-01)

Distributed stochastic gradient descent for link prediction in signed social networks
per: Han Zhang, et al.
Publicat: (2019-01-01)

Belief-Rule-Base Inference Method Based on Gradient Descent With Momentum
per: Yu Guan, et al.
Publicat: (2021-01-01)

Training Neural Networks by Time-Fractional Gradient Descent
per: Jingyi Xie, et al.
Publicat: (2022-09-01)

Function approximation method based on weights gradient descent in reinforcement learning
per: Xiaoyan QIN, et al.
Publicat: (2023-08-01)

Function approximation method based on weights gradient descent in reinforcement learning
per: Xiaoyan QIN, Yuhan LIU, Yunlong XU, Bin LI
Publicat: (2023-08-01)

Restoration of Degraded Images Using Pupil-Size Diversity Technology With Stochastic Parallel Gradient Descent Algorithm
per: Zongliang Xie, et al.
Publicat: (2016-01-01)

Phase Optimized Computer-Generated Holographic Video Calculation With Frame Interpolation Using Gradient Descent Algorithm
per: Gyeongsu Jin, et al.
Publicat: (2024-01-01)

Forest fire risk assessment model optimized by stochastic average gradient descent
per: Zexin Fu, et al.
Publicat: (2025-01-01)

aSGD: Stochastic Gradient Descent with Adaptive Batch Size for Every Parameter
per: Haoze Shi, et al.
Publicat: (2022-03-01)