Boyi Liu

Affiliations:

Northwestern University, IL, USA

According to our database¹, Boyi Liu authored at least 19 papers between 2019 and 2025.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Links

On csauthors.net:

Bibliography

2025

BRiTE: Bootstrapping Reinforced Thinking Process to Enhance Language Model Reasoning.

[BibT_eX]

[DOI]

CoRR, January, 2025

2024

Reward-Augmented Data Enhances Direct Preference Alignment of LLMs.

[BibT_eX]

[DOI]

CoRR, 2024

Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 38: Annual Conference on Neural Information Processing Systems 2024, 2024

Reason for Future, Act for Now: A Principled Architecture for Autonomous LLM Agents.

[BibT_eX]

[DOI]

Proceedings of the Forty-first International Conference on Machine Learning, 2024

Let Models Speak Ciphers: Multiagent Debate through Embeddings.

[BibT_eX]

[DOI]

Proceedings of the Twelfth International Conference on Learning Representations, 2024

2023

Double Duality: Variational Primal-Dual Policy Optimization for Constrained Reinforcement Learning.

[BibT_eX]

[DOI]

J. Mach. Learn. Res., 2023

Reason for Future, Act for Now: A Principled Framework for Autonomous LLM Agents with Provable Sample Efficiency.

[BibT_eX]

[DOI]

CoRR, 2023

Model-Based Reparameterization Policy Gradient Methods: Theory and Practical Algorithms.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 36: Annual Conference on Neural Information Processing Systems 2023, 2023

Achieving Hierarchy-Free Approximation for Bilevel Programs with Equilibrium Constraints.

[BibT_eX]

[DOI]

Proceedings of the International Conference on Machine Learning, 2023

Differentiable Arbitrating in Zero-sum Markov Games.

[BibT_eX]

[DOI]

Proceedings of the 2023 International Conference on Autonomous Agents and Multiagent Systems, 2023

2022

An Analysis of Attention via the Lens of Exchangeability and Latent Variable Models.

[BibT_eX]

[DOI]

CoRR, 2022

Differentiable Bilevel Programming for Stackelberg Congestion Games.

[BibT_eX]

[DOI]

CoRR, 2022

Relational Reasoning via Set Transformers: Provable Efficiency and Applications to MARL.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 35: Annual Conference on Neural Information Processing Systems 2022, 2022

Inducing Equilibria via Incentives: Simultaneous Design-and-Play Ensures Global Convergence.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 35: Annual Conference on Neural Information Processing Systems 2022, 2022

2021

Inducing Equilibria via Incentives: Simultaneous Design-and-Play Finds Global Optima.

[BibT_eX]

[DOI]

CoRR, 2021

BooVI: Provably Efficient Bootstrapped Value Iteration.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 34: Annual Conference on Neural Information Processing Systems 2021, 2021

2019

Neural Proximal/Trust Region Policy Optimization Attains Globally Optimal Policy.

[BibT_eX]

[DOI]

CoRR, 2019

Neural Trust Region/Proximal Policy Optimization Attains Globally Optimal Policy.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems 2019, 2019

Off-Policy Evaluation and Learning from Logged Bandit Feedback: Error Reduction via Surrogate Policy.

[BibT_eX]

[DOI]

Proceedings of the 7th International Conference on Learning Representations, 2019

Boyi Liu

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...