We stand with Ukraine

We stand with Ukraine

Yasin Abbasi-Yadkori

Affiliations:

Adobe Research
Queensland University of Technology, Australia (former)

According to our database¹, Yasin Abbasi-Yadkori authored at least 58 papers between 2006 and 2023.

Collaborative distances:

Dijkstra number² of three.
Erdős number³ of three.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Links

Online presence:

on yasinov.github.io
on scholar.google.com

On csauthors.net:

Bibliography

2023

Context-lumpable stochastic bandits.

[BibT_eX]

[DOI]

,

,

Yasin Abbasi-Yadkori

,

,

,

Csaba Szepesvári

Proceedings of the Advances in Neural Information Processing Systems 36: Annual Conference on Neural Information Processing Systems 2023, 2023

2022

Non-stationary Bandits and Meta-Learning with a Small Set of Optimal Arms.

[BibT_eX]

[DOI]

Mohammad Javad Azizi

,

,

Yasin Abbasi-Yadkori

,

András György

,

,

Mohammad Ghavamzadeh

CoRR, 2022

A New Look at Dynamic Regret for Non-Stationary Stochastic Bandits.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

András György

,

CoRR, 2022

Feature and Parameter Selection in Stochastic Linear Bandits.

[BibT_eX]

[DOI]

Ahmadreza Moradipari

,

,

Yasin Abbasi-Yadkori

,

Mahnoosh Alizadeh

,

Mohammad Ghavamzadeh

Proceedings of the International Conference on Machine Learning, 2022

Efficient local planning with linear function approximation.

[BibT_eX]

[DOI]

,

,

Yasin Abbasi-Yadkori

,

,

Csaba Szepesvári

Proceedings of the International Conference on Algorithmic Learning Theory, 29 March, 2022

Confident Least Square Value Iteration with Local Access to a Simulator.

[BibT_eX]

[DOI]

,

,

,

Yasin Abbasi-Yadkori

,

Csaba Szepesvári

Proceedings of the International Conference on Artificial Intelligence and Statistics, 2022

2021

Parameter and Feature Selection in Stochastic Linear Bandits.

[BibT_eX]

[DOI]

Ahmadreza Moradipari

,

Yasin Abbasi-Yadkori

,

Mahnoosh Alizadeh

,

Mohammad Ghavamzadeh

CoRR, 2021

Optimization Issues in KL-Constrained Approximate Policy Iteration.

[BibT_eX]

[DOI]

,

,

Yasin Abbasi-Yadkori

,

Dale Schuurmans

,

Csaba Szepesvári

CoRR, 2021

Improved Regret Bound and Experience Replay in Regularized Policy Iteration.

[BibT_eX]

[DOI]

,

,

Yasin Abbasi-Yadkori

,

Csaba Szepesvári

Proceedings of the 38th International Conference on Machine Learning, 2021

On Query-efficient Planning in MDPs under Linear Realizability of the Optimal State-value Function.

[BibT_eX]

[DOI]

,

Philip Amortila

,

Barnabás Janzer

,

Yasin Abbasi-Yadkori

,

,

Csaba Szepesvári

Proceedings of the Conference on Learning Theory, 2021

Adaptive Approximate Policy Iteration.

[BibT_eX]

[DOI]

,

,

Yasin Abbasi-Yadkori

,

,

Csaba Szepesvári

Proceedings of the 24th International Conference on Artificial Intelligence and Statistics, 2021

2020

The Elliptical Potential Lemma Revisited.

[BibT_eX]

[DOI]

Alexandra Carpentier

,

,

Yasin Abbasi-Yadkori

CoRR, 2020

Regret Balancing for Bandit and RL Model Selection.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

,

CoRR, 2020

Provably Efficient Adaptive Approximate Policy Iteration.

[BibT_eX]

[DOI]

,

,

Yasin Abbasi-Yadkori

,

,

Csaba Szepesvári

CoRR, 2020

A Structural Graph Representation Learning Framework.

[BibT_eX]

[DOI]

,

Nesreen K. Ahmed

,

,

,

,

Yasin Abbasi-Yadkori

Proceedings of the WSDM '20: The Thirteenth ACM International Conference on Web Search and Data Mining, 2020

Model Selection in Contextual Stochastic Bandit Problems.

[BibT_eX]

[DOI]

,

,

Yasin Abbasi-Yadkori

,

,

,

,

Csaba Szepesvári

Proceedings of the Advances in Neural Information Processing Systems 33: Annual Conference on Neural Information Processing Systems 2020, 2020

2019

Exploration-Enhanced POLITEX.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

,

Csaba Szepesvári

,

CoRR, 2019

Large-Scale Markov Decision Problems via the Linear Programming Dual.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

Peter L. Bartlett

,

,

CoRR, 2019

On Densification for Minwise Hashing.

[BibT_eX]

[DOI]

,

,

Matt Kapilevich

,

,

Yasin Abbasi-Yadkori

,

Proceedings of the Thirty-Fifth Conference on Uncertainty in Artificial Intelligence, 2019

Thompson Sampling and Approximate Inference.

[BibT_eX]

[DOI]

,

Yasin Abbasi-Yadkori

,

Proceedings of the Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems 2019, 2019

Bootstrapping Upper Confidence Bound.

[BibT_eX]

[DOI]

,

Yasin Abbasi-Yadkori

,

,

Proceedings of the Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems 2019, 2019

Sample Efficient Graph-Based Optimization with Noisy Observations.

[BibT_eX]

[DOI]

Thanh Tan Nguyen

,

,

Yasin Abbasi-Yadkori

,

,

Branislav Kveton

Proceedings of the 22nd International Conference on Artificial Intelligence and Statistics, 2019

Optimizing over a Restricted Policy Class in MDPs.

[BibT_eX]

[DOI]

Ershad Banijamali

,

Yasin Abbasi-Yadkori

,

Mohammad Ghavamzadeh

,

Proceedings of the 22nd International Conference on Artificial Intelligence and Statistics, 2019

Model-Free Linear Quadratic Control via Reduction to Expert Prediction.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

,

Csaba Szepesvári

Proceedings of the 22nd International Conference on Artificial Intelligence and Statistics, 2019

2018

New Insights into Bootstrapping for Bandits.

[BibT_eX]

[DOI]

,

Branislav Kveton

,

,

,

,

Yasin Abbasi-Yadkori

CoRR, 2018

Sharp Convergence Rates for Langevin Dynamics in the Nonconvex Setting.

[BibT_eX]

[DOI]

,

Niladri S. Chatterji

,

Yasin Abbasi-Yadkori

,

Peter L. Bartlett

,

Michael I. Jordan

CoRR, 2018

Regret Bounds for Model-Free Linear Quadratic Control.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

,

Csaba Szepesvári

CoRR, 2018

Optimizing over a Restricted Policy Class in Markov Decision Processes.

[BibT_eX]

[DOI]

Ershad Banijamali

,

Yasin Abbasi-Yadkori

,

Mohammad Ghavamzadeh

,

CoRR, 2018

A Continuation Method for Discrete Optimization and its Application to Nearest Neighbor Classification.

[BibT_eX]

[DOI]

,

Yasin Abbasi-Yadkori

CoRR, 2018

Scalar Posterior Sampling with Applications.

[BibT_eX]

[DOI]

Georgios Theocharous

,

,

,

Proceedings of the Advances in Neural Information Processing Systems 31: Annual Conference on Neural Information Processing Systems 2018, 2018

Offline Evaluation of Ranking Policies with Click Models.

[BibT_eX]

[DOI]

,

Yasin Abbasi-Yadkori

,

Branislav Kveton

,

S. Muthukrishnan

,

,

Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 2018

Best of both worlds: Stochastic & adversarial best-arm identification.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

Peter L. Bartlett

,

Victor Gabillon

,

,

Proceedings of the Conference On Learning Theory, 2018

2017

Stochastic Low-Rank Bandits.

[BibT_eX]

[DOI]

Branislav Kveton

,

Csaba Szepesvári

,

,

,

Yasin Abbasi-Yadkori

,

S. Muthukrishnan

CoRR, 2017

Posterior Sampling for Large Scale Reinforcement Learning.

[BibT_eX]

[DOI]

Georgios Theocharous

,

,

Yasin Abbasi-Yadkori

,

CoRR, 2017

Conservative Contextual Linear Bandits.

[BibT_eX]

[DOI]

Abbas Kazerouni

,

Mohammad Ghavamzadeh

,

,

Benjamin Van Roy

Proceedings of the Advances in Neural Information Processing Systems 30: Annual Conference on Neural Information Processing Systems 2017, 2017

Near Minimax Optimal Players for the Finite-Time 3-Expert Prediction Problem.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

Peter L. Bartlett

,

Victor Gabillon

Proceedings of the Advances in Neural Information Processing Systems 30: Annual Conference on Neural Information Processing Systems 2017, 2017

Hit-and-Run for Sampling and Planning in Non-Convex Spaces.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

Peter L. Bartlett

,

Victor Gabillon

,

Proceedings of the 20th International Conference on Artificial Intelligence and Statistics, 2017

2016

A Fast and Reliable Policy Improvement Algorithm.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

Peter L. Bartlett

,

Stephen J. Wright

Proceedings of the 19th International Conference on Artificial Intelligence and Statistics, 2016

2015

Bayesian Optimal Control of Smoothly Parameterized Systems.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

Csaba Szepesvári

Proceedings of the Thirty-First Conference on Uncertainty in Artificial Intelligence, 2015

Minimax Time Series Prediction.

[BibT_eX]

[DOI]

Wouter M. Koolen

,

,

Peter L. Bartlett

,

Yasin Abbasi-Yadkori

Proceedings of the Advances in Neural Information Processing Systems 28: Annual Conference on Neural Information Processing Systems 2015, 2015

Large-Scale Markov Decision Problems with KL Control Cost and its Application to Crowdsourcing.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

Peter L. Bartlett

,

,

Proceedings of the 32nd International Conference on Machine Learning, 2015

2014

Bayesian Optimal Control of Smoothly Parameterized Systems: The Lazy Posterior Sampling Algorithm.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

Csaba Szepesvári

CoRR, 2014

Online learning in MDPs with side information.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

CoRR, 2014

Prediction with Limited Advice and Multiarmed Bandits with Paid Observations.

[BibT_eX]

[DOI]

,

Peter L. Bartlett

,

,

Yasin Abbasi-Yadkori

Proceedings of the 31th International Conference on Machine Learning, 2014

Linear Programming for Large-Scale Markov Decision Problems.

[BibT_eX]

[DOI]

,

Yasin Abbasi-Yadkori

,

Peter L. Bartlett

Proceedings of the 31th International Conference on Machine Learning, 2014

Tracking Adversarial Targets.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

Peter L. Bartlett

,

Proceedings of the 31th International Conference on Machine Learning, 2014

2013

Online Learning in Markov Decision Processes with Adversarially Chosen Transition Probability Distributions

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

Peter L. Bartlett

,

Csaba Szepesvári

CoRR, 2013

Online Learning in Markov Decision Processes with Adversarially Chosen Transition Probability Distributions.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

Peter L. Bartlett

,

,

,

Csaba Szepesvári

Proceedings of the Advances in Neural Information Processing Systems 26: 27th Annual Conference on Neural Information Processing Systems 2013. Proceedings of a meeting held December 5-8, 2013

2012

Online-to-Confidence-Set Conversions and Application to Sparse Stochastic Bandits.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

,

Csaba Szepesvári

Proceedings of the Fifteenth International Conference on Artificial Intelligence and Statistics, 2012

Evaluation and Analysis of the Performance of the EXP3 Algorithm in Stochastic Environments.

[BibT_eX]

[DOI]

,

Csaba Szepesvári

,

,

Yasin Abbasi-Yadkori

Proceedings of the Tenth European Workshop on Reinforcement Learning, 2012

2011

Regret Bounds for the Adaptive Control of Linear Quadratic Systems.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

Csaba Szepesvári

Proceedings of the COLT 2011, 2011

Online Least Squares Estimation with Self-Normalized Processes: An Application to Bandit Problems

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

,

Csaba Szepesvári

CoRR, 2011

Improved Algorithms for Linear Stochastic Bandits.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

,

Csaba Szepesvári

Proceedings of the Advances in Neural Information Processing Systems 24: 25th Annual Conference on Neural Information Processing Systems 2011. Proceedings of a meeting held 12-14 December 2011, 2011

Fast Approximate Nearest-Neighbor Search with k-Nearest Neighbor Graph.

[BibT_eX]

[DOI]

,

Yasin Abbasi-Yadkori

,

Hossein Shahbazi

,

Proceedings of the IJCAI 2011, 2011

2010

Extending rapidly-exploring random trees for asymptotically optimal anytime motion planning.

[BibT_eX]

[DOI]

Yasin Abbasi-Yadkori

,

,

Csaba Szepesvári

Proceedings of the 2010 IEEE/RSJ International Conference on Intelligent Robots and Systems, 2010

2009

Improved Mean and Variance Approximations for Belief Net Responses via Network Doubling.

[BibT_eX]

[DOI]

,

Yasin Abbasi-Yadkori

,

Russell Greiner

,

Proceedings of the UAI 2009, 2009

Learning when to stop thinking and do something!

[BibT_eX]

[DOI]

Barnabás Póczos

,

Yasin Abbasi-Yadkori

,

Csaba Szepesvári

,

Russell Greiner

,

Nathan R. Sturtevant

Proceedings of the 26th Annual International Conference on Machine Learning, 2009

2006

A heuristic routing mechanism using a new addressing scheme.

[BibT_eX]

[DOI]

Mohsen Ravanbakhsh

,

Yasin Abbasi-Yadkori

,

Maghsoud Abbaspour

,

Hamid Sarbazi-Azad

Proceedings of the 1st International ICST Conference on Bio Inspired Models of Network, 2006

Loading...