Learning and value function approximation in complex decision processes
Thesis (Ph. D.)--Massachusetts Institute of Technology, Dept. of Electrical Engineering and Computer Science, 1998.
Հիմնական հեղինակ: | Van Roy, Benjamin |
---|---|
Այլ հեղինակներ: | John N. Tsitsiklis. |
Ձևաչափ: | Թեզիս |
Լեզու: | eng |
Հրապարակվել է: |
Massachusetts Institute of Technology
2005
|
Խորագրեր: | |
Առցանց հասանելիություն: | http://hdl.handle.net/1721.1/9960 |
Նմանատիպ նյութեր
-
Approximate solution methods for partially observable Markov and semi-Markov decision processes
: Yu, Huizhen, Ph. D. Massachusetts Institute of Technology
Հրապարակվել է: (2007) -
Making discrete decisions based on continuous values
: Sherman, Benjamin (Benjamin Marc)
Հրապարակվել է: (2017) -
Multiple machine maintenance : applying a separable value function approximation to a variation of the multiarmed bandit
: Lin, Haixia, 1977-
Հրապարակվել է: (2014) -
Realization and approximation of stationary stochastic processes
: Avniel, Yehuda
Հրապարակվել է: (2005) -
Training hierarchical networks for function approximation
: Miranda, Brando, M. Eng. Massachusetts Institute of Technology
Հրապարակվել է: (2018)