Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies, 2025

Score as Action: Fine Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning.

[BibT_eX]

[DOI]

Hanyang Zhao

Proceedings of the Forty-second International Conference on Machine Learning, 2025

RainbowPO: A Unified Framework for Combining Improvements in Preference Optimization.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

MallowsPO: Fine-Tune Your LLM with Preference Dispersions.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

2024

WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines.

[BibT_eX]

[DOI]

Genta Indra Winata

Frederikus Hudi

Patrick Amadeus Irawan

Ubaidillah Ariq Prathama

Haryo Akbarianto Wibowo

Holy Lovenia

Jan Christian Blaise Cruz

Jan Wira Gotama Putra

Junho Myung

Lucky Susanto

Maria Angelica Riera Machin

Marina Zhukova

Michael Anugraha

Muhammad Farid Adilazuarda

Natasha Santosa

Peerat Limkonchotiwat

Stephanie Yulia Salim

Yi Zhou

Yinxuan Gui

David Ifeoluwa Adelani

CoRR, 2024

RainbowPO: A Unified Framework for Combining Improvements in Preference Optimization.

[BibT_eX]

[DOI]

CoRR, 2024

Preference Tuning with Human Feedback on Language, Speech, and Vision Tasks: A Survey.

[BibT_eX]

[DOI]

CoRR, 2024

Scores as Actions: a framework of fine-tuning diffusion models by continuous-time reinforcement learning.

[BibT_eX]

[DOI]

CoRR, 2024

Mallows-DPO: Fine-Tune Your LLM with Preference Dispersions.

[BibT_eX]

[DOI]

CoRR, 2024

Score-based Diffusion Models via Stochastic Differential Equations - a Technical Tutorial.

[BibT_eX]

[DOI]

Wenpin Tang

Hanyang Zhao

CoRR, 2024

Contractive Diffusion Probabilistic Models.

[BibT_eX]

[DOI]

Wenpin Tang

Hanyang Zhao

CoRR, 2024

2023

Policy Optimization for Continuous Reinforcement Learning.

[BibT_eX]

[DOI]

Hanyang Zhao

Wenpin Tang

David D. Yao

Proceedings of the Advances in Neural Information Processing Systems 36: Annual Conference on Neural Information Processing Systems 2023, 2023

Hanyang Zhao

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...