Breaking the deadly triad with a target network
The deadly triad refers to the instability of a reinforcement learning algorithm when it employs off-policy learning, function approximation, and bootstrapping simultaneously. In this paper, we investigate the target network as a tool for breaking the deadly triad, providing theoretical support for...
প্রধান লেখক: | Zhang, S, Yao, H, Whiteson, S |
---|---|
বিন্যাস: | Conference item |
ভাষা: | English |
প্রকাশিত: |
PMLR
2021
|
অনুরূপ উপাদানগুলি
-
Breaking the deadly triad in reinforcement learning
অনুযায়ী: Zhang, S
প্রকাশিত: (2022) -
Austrian syndrome: The deadly triad
অনুযায়ী: Yong Il Shin, অন্যান্য
প্রকাশিত: (2020-01-01) -
Austrian syndrome: Resurgence of an old and deadly triad
অনুযায়ী: Kristian Rivera, অন্যান্য
প্রকাশিত: (2024-04-01) -
Insulin resistance, impaired postprandial lipid metabolism and abdominal obesity. A deadly triad.
অনুযায়ী: Frayn, K
প্রকাশিত: (2002) -
The Role of Dark Triad of Personality, Material Preoccupations, and Sorrow of Being Compared in Deadly Sins
অনুযায়ী: Ghasem Ahi
প্রকাশিত: (2019-09-01)