StreamingBandit: Experimenting with Bandit Policies

StreamingBandit: Experimenting with Bandit Policies

A large number of statistical decision problems in the social sciences and beyond can be framed as a (contextual) multi-armed bandit problem. However, it is notoriously hard to develop and evaluate policies that tackle these types of problems, and to use such policies in applied studies. To address...

Full description

Bibliographic Details
Main Authors:	Jules Kruijswijk, Robin van Emden, Petri Parvinen, Maurits Kaptein
Format:	Article
Language:	English
Published:	Foundation for Open Access Statistics 2020-08-01
Series:	Journal of Statistical Software
Subjects:	sequential decision-making multi-armed bandit data streams sequential experimentation python
Online Access:	https://www.jstatsoft.org/index.php/jss/article/view/2881

Similar Items

The Perils of Misspecified Priors and Optional Stopping in Multi-Armed Bandits
by: Markus Loecher
Published: (2021-07-01)

A linear response bandit problem
by: Assaf Zeevi, et al.
Published: (2013-01-01)

Signal detection models as contextual bandits
by: Thomas N. Sherratt, et al.
Published: (2023-06-01)

Multi-armed linear bandits with latent biases
by: Kang, Qiyu, et al.
Published: (2024)

Bandit Learning-Based Edge Caching for 360-Degree Video Streaming With Switching Cost
by: Zhendong Yu, et al.
Published: (2022-01-01)

Multi-arm bandit-led clustering in federated learning
by: Zhao, Joe Chen Xuan
Published: (2024)

Non-Stationary Linear Bandits With Dimensionality Reduction for Large-Scale Recommender Systems
by: Saeed Ghoorchian, et al.
Published: (2024-01-01)

Conservative Contextual Combinatorial Cascading Bandit
by: Kun Wang
Published: (2021-01-01)

Design of Multi-Armed Bandit-Based Routing for in-Network Caching
by: Gen Tabei, et al.
Published: (2023-01-01)

On the Conjecture of Berry Regarding a Bernoulli Two-Armed Bandit
by: Jichen Zhang, et al.
Published: (2023-02-01)

Markovian Restless Bandits and Index Policies: A Review
by: José Niño-Mora
Published: (2023-03-01)

Bandit Learning-Based Distributed Computation in Fog Computing Networks: A Survey
by: Hoa Tran-Dang, et al.
Published: (2023-01-01)

LEO-Assisted Aerial Deployment in Post-Disaster Scenarios Using a Combinatorial Bandit and Genetic Algorithmic Approach
by: Ehab Mahmoud Mohamed, et al.
Published: (2023-12-01)

Altered statistical learning and decision-making in methamphetamine dependence: Evidence from a two-armed bandit task
by: Katia M Harlé, et al.
Published: (2015-12-01)

Fast Two-Stage Computation of an Index Policy for Multi-Armed Bandits with Setup Delays
by: José Niño-Mora
Published: (2020-12-01)

A multi-armed bandit approach for exploring partially observed networks
by: Kaushalya Madhawa, et al.
Published: (2019-05-01)

Hedging using reinforcement learning: Contextual k-armed bandit versus Q-learning
by: Loris Cannelli, et al.
Published: (2023-11-01)

Non Stationary Multi-Armed Bandit: Empirical Evaluation of a New Concept Drift-Aware Algorithm
by: Emanuele Cavenaghi, et al.
Published: (2021-03-01)

Multi-Armed Bandit Algorithm Policy for LoRa Network Performance Enhancement
by: Anjali R. Askhedkar, et al.
Published: (2023-05-01)

An embedded bandit algorithm based on agent evolution for cold-start problem
by: Rui Qiu, et al.
Published: (2021-11-01)

Non-Stationary Bandit Strategy for Rate Adaptation With Delayed Feedback
by: Yapeng Zhao, et al.
Published: (2020-01-01)

Multi-Armed Bandits in Brain-Computer Interfaces
by: Frida Heskebeck, et al.
Published: (2022-07-01)

Maximum Entropy Exploration in Contextual Bandits with Neural Networks and Energy Based Models
by: Adam Elwood, et al.
Published: (2023-01-01)

Multi-armed bandit based device scheduling for crowdsensing in power grids
by: Jie Zhao, et al.
Published: (2023-02-01)

Learning the Truth in Social Networks Using Multi-Armed Bandit
by: Olusola T. Odeyomi
Published: (2020-01-01)

Bandit Algorithm Driven by a Classical Random Walk and a Quantum Walk
by: Tomoki Yamagami, et al.
Published: (2023-05-01)

Stochastic programming based multi-arm bandit offloading strategy for internet of things
by: Bin Cao, et al.
Published: (2023-10-01)

Multi-Armed Bandits for Spectrum Allocation in Multi-Agent Channel Bonding WLANs
by: Sergio Barrachina-Munoz, et al.
Published: (2021-01-01)

Spectrum Allocation and User Scheduling Based on Combinatorial Multi-Armed Bandit for 5G Massive MIMO
by: Jian Dou, et al.
Published: (2023-08-01)

Bandit Learning with Concurrent Transmissions for Energy-Efficient Flooding in Sensor Networks
by: Peilin Zhang, et al.
Published: (2018-03-01)

Multi-Gear Bandits, Partial Conservation Laws, and Indexability
by: José Niño-Mora
Published: (2022-07-01)

Achieving User-Side Fairness in Contextual Bandits
by: Wen Huang, et al.
Published: (2022-09-01)

An Analysis of the Value of Information When Exploring Stochastic, Discrete Multi-Armed Bandits
by: Isaac J. Sledge, et al.
Published: (2018-02-01)

Study of Multi-Armed Bandits for Energy Conservation in Cognitive Radio Sensor Networks
by: Juan Zhang, et al.
Published: (2015-04-01)

Gateway Selection in Millimeter Wave UAV Wireless Networks Using Multi-Player Multi-Armed Bandit
by: Ehab Mahmoud Mohamed, et al.
Published: (2020-07-01)

Transfer restless multi-armed bandit policy for energy-efficient heterogeneous cellular network
by: Navikkumar Modi, et al.
Published: (2019-10-01)

Risk-aware multi-armed bandit problem with application to portfolio selection
by: Xiaoguang Huo, et al.
Published: (2017-01-01)

Proactive Edge Caching in Vehicular Networks: An Online Bandit Learning Approach
by: Qiao Wang, et al.
Published: (2022-01-01)

Bayesian Contextual Bandits for Hyper Parameter Optimization
by: Guoxin Sui, et al.
Published: (2020-01-01)

Online Learning of Time-Varying Unbalanced Networks in Non-Convex Environments: A Multi-Armed Bandit Approach
by: Olusola T. Odeyomi
Published: (2023-01-01)