Pratik Gajane

Jawar Singh

CoRR, March, 2026

Evaluating Causal Discovery Algorithms for Path-Specific Fairness and Utility in Healthcare.

[BibT_eX]

[DOI]

CoRR, March, 2026

2024

Adversarial Multi-dueling Bandits.

[BibT_eX]

[DOI]

CoRR, 2024

Investigating Gender Fairness in Machine Learning-driven Personalized Care for Chronic Pain.

[BibT_eX]

[DOI]

Sean Newman

John D. Piette

CoRR, 2024

Multi-armed Bandits with Generalized Temporally-Partitioned Rewards.

[BibT_eX]

[DOI]

Ronald C. van den Broek

Proceedings of the Advances in Intelligent Data Analysis XXII, 2024

2023

Provably Efficient Exploration in Constrained Reinforcement Learning: Posterior Sampling Is All You Need.

[BibT_eX]

[DOI]

CoRR, 2023

Multi-Armed Bandits with Generalized Temporally-Partitioned Rewards.

[BibT_eX]

[DOI]

Ronald C. van den Broek

CoRR, 2023

Curiosity-driven Exploration in Sparse-reward Multi-agent Reinforcement Learning.

[BibT_eX]

[DOI]

Jiong Li

CoRR, 2023

Local Differential Privacy for Sequential Decision Making in a Changing Environment.

[BibT_eX]

[DOI]

CoRR, 2023

WeHeart: A Personalized Recommendation Device for Physical Activity Encouragement and Preventing "Cold Start" in Cardiac Rehabilitation.

[BibT_eX]

[DOI]

Proceedings of the Human-Computer Interaction - INTERACT 2023 - 19th IFIP TC13 International Conference, York, UK, August 28, 2023

Autonomous Exploration for Navigating in MDPs Using Blackbox RL Algorithms.

[BibT_eX]

[DOI]

Filipo Studzinski Perotto

Proceedings of the Thirty-Second International Joint Conference on Artificial Intelligence, 2023

LEMON: Alternative Sampling for More Faithful Explanation Through Local Surrogate Models.

[BibT_eX]

[DOI]

Proceedings of the Advances in Intelligent Data Analysis XXI, 2023

WeHeart: A Personalized Recommendation Device for Physical Activity Encouragement in Cardiac Rehabilitation.

[BibT_eX]

[DOI]

Proceedings of the HHAI 2023: Augmenting Human Intellect, 2023

2022

Generalizing distribution of partial rewards for multi-armed bandits with temporally-partitioned rewards.

[BibT_eX]

[DOI]

Ronald C. van den Broek

CoRR, 2022

An Empirical Evaluation of Posterior Sampling for Constrained Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, 2022

Survey on Fair Reinforcement Learning: Theory and Practice.

[BibT_eX]

[DOI]

CoRR, 2022

The Impact of Batch Learning in Stochastic Linear Bandits.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Data Mining, 2022

2021

The Impact of Batch Learning in Stochastic Bandits.

[BibT_eX]

[DOI]

CoRR, 2021

Gambler Bandits and the Regret of Being Ruined.

[BibT_eX]

[DOI]

Proceedings of the AAMAS '21: 20th International Conference on Autonomous Agents and Multiagent Systems, 2021

2019

Autonomous exploration for navigating in non-stationary CMPs.

[BibT_eX]

[DOI]

CoRR, 2019

Variational Regret Bounds for Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Fifth Conference on Uncertainty in Artificial Intelligence, 2019

Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes.

[BibT_eX]

[DOI]

Proceedings of the Conference on Learning Theory, 2019

Achieving Optimal Dynamic Regret for Non-stationary Bandits without Prior Information.

[BibT_eX]

[DOI]

Proceedings of the Conference on Learning Theory, 2019

2018

A Sliding-Window Algorithm for Markov Decision Processes with Arbitrarily Changing Rewards and Transitions.

[BibT_eX]

[DOI]

CoRR, 2018

Corrupt Bandits for Preserving Local Privacy.

[BibT_eX]

[DOI]

Emilie Kaufmann

Proceedings of the Algorithmic Learning Theory, 2018

2017

Bandits Multi-bras avec retour d'information non-conventionnelle. (Multi-Armed Bandits with Unconventional Feedback).

[BibT_eX]

[DOI]

PhD thesis, 2017

Counterfactual Learning for Machine Translation: Degeneracies and Solutions.

[BibT_eX]

[DOI]

Carolin Lawrence

Stefan Riezler

CoRR, 2017

On formalizing fairness in prediction with machine learning.

[BibT_eX]

[DOI]

CoRR, 2017

Corrupt Bandits for Privacy Preserving Input.

[BibT_eX]

[DOI]

Emilie Kaufmann

CoRR, 2017

2015

Utility-based Dueling Bandits as a Partial Monitoring Game.

[BibT_eX]

[DOI]

CoRR, 2015

A Relative Exponential Weighing Algorithm for Adversarial Utility-based Dueling Bandits.

[BibT_eX]

[DOI]