Wenpin Tang

Renyuan Xu

CoRR, February, 2026

ART for Diffusion Sampling: A Reinforcement Learning Approach to Timestep Schedule.

[BibT_eX]

[DOI]

Yilie Huang

CoRR, January, 2026

2025

SOCRATES: Simulation Optimization with Correlated Replicas and Adaptive Trajectory Evaluations.

[BibT_eX]

[DOI]

CoRR, November, 2025

Understanding Sampler Stochasticity in Training Diffusion Models for RLHF.

[BibT_eX]

[DOI]

CoRR, October, 2025

DiFFPO: Training Diffusion LLMs to Reason Fast and Furious via Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, October, 2025

Diffusion Generative Models Meet Compressed Sensing, with Applications to Imaging and Finance.

[BibT_eX]

[DOI]

CoRR, September, 2025

Fine-Tuning Diffusion Generative Models via Rich Preference Optimization.

[BibT_eX]

[DOI]

CoRR, March, 2025

The Convergence Rate of Vanishing Viscosity Approximations for Mean Field Games.

[BibT_eX]

[DOI]

SIAM J. Math. Anal., 2025

Policy Iteration for the Deterministic Control Problems - A Viscosity Approach.

[BibT_eX]

[DOI]

Hung V. Tran

SIAM J. Control. Optim., 2025

Polynomial Voting Rules.

[BibT_eX]

[DOI]

David D. Yao

Math. Oper. Res., 2025

Preference Tuning with Human Feedback on Language, Speech, and Vision Tasks: A Survey.

[BibT_eX]

[DOI]

J. Artif. Intell. Res., 2025

Score as Action: Fine Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Forty-second International Conference on Machine Learning, 2025

RainbowPO: A Unified Framework for Combining Improvements in Preference Optimization.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

MallowsPO: Fine-Tune Your LLM with Preference Dispersions.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

2024

Regret of exploratory policy improvement and <i>q</i>-learning.

[BibT_eX]

[DOI]

CoRR, 2024

RainbowPO: A Unified Framework for Combining Improvements in Preference Optimization.

[BibT_eX]

[DOI]

CoRR, 2024

Preference Tuning with Human Feedback on Language, Speech, and Vision Tasks: A Survey.

[BibT_eX]

[DOI]

CoRR, 2024

Scores as Actions: a framework of fine-tuning diffusion models by continuous-time reinforcement learning.

[BibT_eX]

[DOI]

CoRR, 2024

Mallows-DPO: Fine-Tune Your LLM with Preference Dispersions.

[BibT_eX]

[DOI]

CoRR, 2024

Fine-tuning of diffusion models via stochastic control: entropy regularization and beyond.

[BibT_eX]

[DOI]

CoRR, 2024

Score-based Diffusion Models via Stochastic Differential Equations - a Technical Tutorial.

[BibT_eX]

[DOI]

Hanyang Zhao

CoRR, 2024

Contractive Diffusion Probabilistic Models.

[BibT_eX]

[DOI]

Hanyang Zhao

CoRR, 2024

2023

Inference for Gaussian Processes with Matern Covariogram on Compact Riemannian Manifolds.

[BibT_eX]

[DOI]

Didong Li

Sudipto Banerjee

J. Mach. Learn. Res., 2023

Transaction fee mechanism for Proof-of-Stake protocol.

[BibT_eX]

[DOI]

David D. Yao

CoRR, 2023

Policy iteration for the deterministic control problems - a viscosity approach.

[BibT_eX]

[DOI]

Hung Vinh Tran

CoRR, 2023

Policy Optimization for Continuous Reinforcement Learning.

[BibT_eX]

[DOI]

Hanyang Zhao

David D. Yao

Proceedings of the Advances in Neural Information Processing Systems 36: Annual Conference on Neural Information Processing Systems 2023, 2023

2022

Exploratory HJB Equations and Their Convergence.

[BibT_eX]

[DOI]

SIAM J. Control. Optim., 2022

A Class of Stochastic Games and Moving Free Boundary Problems.

[BibT_eX]

[DOI]

Renyuan Xu

SIAM J. Control. Optim., 2022

Asset selection via correlation blockmodel clustering.

[BibT_eX]

[DOI]

Xiao Xu

Expert Syst. Appl., 2022

2021

Arcsine laws for random walks generated from random permutations with applications to genomics.

[BibT_eX]

[DOI]

J. Appl. Probab., 2021

2020

Learning an arbitrary mixture of two multinomial logits.

[BibT_eX]

[DOI]

CoRR, 2020

Perturbed gradient descent with occupation time.

[BibT_eX]

[DOI]

Jiequn Han

CoRR, 2020

The Buckley-Osthus model and the block preferential attachment model: statistical analysis and application.

[BibT_eX]

[DOI]

Fengmin Tang

Proceedings of the 37th International Conference on Machine Learning, 2020

2019

Exponential ergodicity and convergence for generalized reflected Brownian motion.

[BibT_eX]

[DOI]

Queueing Syst. Theory Appl., 2019

Consistency of the Buckley-Osthus model and the hierarchical preferential attachment model.

[BibT_eX]

[DOI]

Fengmin Tang

CoRR, 2019

Mallows ranking models: maximum likelihood estimate and regeneration.

[BibT_eX]

[DOI]