Stochastic control approach to the multi-armed bandit problems

Stochastic control approach to the multi-armed bandit problems

<p>A multi-armed bandit is the simplest problem to study learning under uncertainty when decisions affect information. A standard approach to the multi-armed bandit often gives a heuristic construction of an algorithm and proves its regret bound. Following a constructive approach, it is often...

Повний опис

Бібліографічні деталі
Автор:	Treetanthiploet, T
Інші автори:	Cohen, S
Формат:	Дисертація
Мова:	English
Опубліковано:	2021
Предмети:	Mathematics Machine learning

Схожі ресурси

Client Selection for Generalization in Accelerated Federated Learning: A Multi-Armed Bandit Approach
за авторством: Dan Ben Ami, та інші
Опубліковано: (2025-01-01)

An Analysis of the Value of Information When Exploring Stochastic, Discrete Multi-Armed Bandits
за авторством: Isaac J. Sledge, та інші
Опубліковано: (2018-02-01)

Output-weighted sampling for multi-armed bandits with extreme payoffs
за авторством: Yang, Yibo, та інші
Опубліковано: (2024)

Risk-aware multi-armed bandit problem with application to portfolio selection
за авторством: Xiaoguang Huo, та інші
Опубліковано: (2017-01-01)

Multi-Armed Bandits in Brain-Computer Interfaces
за авторством: Frida Heskebeck, та інші
Опубліковано: (2022-07-01)

Gateway Selection in Millimeter Wave UAV Wireless Networks Using Multi-Player Multi-Armed Bandit
за авторством: Ehab Mahmoud Mohamed, та інші
Опубліковано: (2020-07-01)

Dynamic Grouping within Minimax Optimal Strategy for Stochastic Multi-ArmedBandits in Reinforcement Learning Recommendation
за авторством: Jiamei Feng, та інші
Опубліковано: (2024-04-01)

Stochastic programming based multi-arm bandit offloading strategy for internet of things
за авторством: Bin Cao, та інші
Опубліковано: (2023-10-01)

Learning the Truth in Social Networks Using Multi-Armed Bandit
за авторством: Olusola T. Odeyomi
Опубліковано: (2020-01-01)

Differential Privacy in Social Networks Using Multi-Armed Bandit
за авторством: Olusola T. Odeyomi
Опубліковано: (2022-01-01)

Regulating exploration in multi-armed bandit problems with time patterns and dying arms
за авторством: Tracà, Stefano
Опубліковано: (2018)

Robust sequential design for piecewise-stationary multi-armed bandit problem in the presence of outliers
за авторством: Yaping Wang, та інші
Опубліковано: (2021-04-01)

Causally abstracted multi-armed bandits
за авторством: Zennaro, FM, та інші
Опубліковано: (2024)

Multi-Armed Bandit-Based User Network Node Selection
за авторством: Qinyan Gao, та інші
Опубліковано: (2024-06-01)

Use of Logarithmic Rates in Multi-Armed Bandit-Based Transmission Rate Control Embracing Frame Aggregations in Wireless Networks
за авторством: Soohyun Cho
Опубліковано: (2023-07-01)

Addictive Games: Case Study on Multi-Armed Bandit Game
за авторством: Xiaohan Kang, та інші
Опубліковано: (2021-12-01)

Multi-armed bandit approach for mean field game-based resource allocation in NOMA networks
за авторством: Amani Benamor, та інші
Опубліковано: (2024-05-01)

Fair Probabilistic Multi-Armed Bandit With Applications to Network Optimization
за авторством: Zhiwu Guo, та інші
Опубліковано: (2024-01-01)

Multi-armed linear bandits with latent biases
за авторством: Kang, Qiyu, та інші
Опубліковано: (2024)

Multi-Armed Bandits for Spectrum Allocation in Multi-Agent Channel Bonding WLANs
за авторством: Sergio Barrachina-Munoz, та інші
Опубліковано: (2021-01-01)

Learning-Based Beamforming for Multi-User Vehicular Communications: A Combinatorial Multi-Armed Bandit Approach
за авторством: Imtiaz Nasim, та інші
Опубліковано: (2020-01-01)

Demystifying the Two-Armed Futurity Bandit’s Unfairness and Apparent Fairness
за авторством: Huaijin Liang, та інші
Опубліковано: (2024-05-01)

Adversarial Autoencoder and Multi-Armed Bandit for Dynamic Difficulty Adjustment in Immersive Virtual Reality for Rehabilitation: Application to Hand Movement
за авторством: Kenta Kamikokuryo, та інші
Опубліковано: (2022-06-01)

A multi-armed bandit approach for exploring partially observed networks
за авторством: Kaushalya Madhawa, та інші
Опубліковано: (2019-05-01)

Multi-armed bandit for species discovery: a Bayesian nonparametric approach
за авторством: Battiston, M, та інші
Опубліковано: (2016)

Non Stationary Multi-Armed Bandit: Empirical Evaluation of a New Concept Drift-Aware Algorithm
за авторством: Emanuele Cavenaghi, та інші
Опубліковано: (2021-03-01)

Solving multi-armed bandit problems using a chaotic microresonator comb
за авторством: Jonathan Cuevas, та інші
Опубліковано: (2024-03-01)

Multi-arm bandit-led clustering in federated learning
за авторством: Zhao, Joe Chen Xuan
Опубліковано: (2024)

Application of Multi-Armed Bandit Algorithm in Quantitative Finance
за авторством: Chen Chengxun, та інші
Опубліковано: (2025-01-01)

Conservative Contextual Combinatorial Cascading Bandit
за авторством: Kun Wang
Опубліковано: (2021-01-01)

ON ERGODIC TWO-ARMED BANDITS
за авторством: Tarres, P, та інші
Опубліковано: (2012)

Transfer restless multi-armed bandit policy for energy-efficient heterogeneous cellular network
за авторством: Navikkumar Modi, та інші
Опубліковано: (2019-10-01)

Enhancing lane detection in autonomous vehicles with multi-armed bandit ensemble learning
за авторством: J. Arun Pandian, та інші
Опубліковано: (2025-01-01)

Contextual Multi-Armed Bandit With Costly Feature Observation in Non-Stationary Environments
за авторством: Saeed Ghoorchian, та інші
Опубліковано: (2024-01-01)

Conservation Laws, Extended Polymatroids and Multi-Armed Bandit Problems; A unified Approach to Indexabel Systems
за авторством: Bertsimas, Dimitris J., та інші
Опубліковано: (2004)

Conservation laws, extended polymatroids and multi-armed bandit problems : a unified approach to indexable systems
за авторством: Bertsimas, Dimitris., та інші
Опубліковано: (2009)

Wi-Fi Assisted Contextual Multi-Armed Bandit for Neighbor Discovery and Selection in Millimeter Wave Device to Device Communications
за авторством: Sherief Hashima, та інші
Опубліковано: (2021-04-01)

A Contextual-Bandit-Based Approach for Informed Decision-Making in Clinical Trials
за авторством: Yogatheesan Varatharajah, та інші
Опубліковано: (2022-08-01)

Decentralized cooperative stochastic bandits
за авторством: Martínez-Rubio, D, та інші
Опубліковано: (2019)

Positioning and power optimisation for UAV-assisted networks in the presence of eavesdroppers: a multi-armed bandit approach
за авторством: Xavier Alejandro Flores Cabezas, та інші
Опубліковано: (2022-09-01)