Yuhui Wang

Orcid: 0000-0002-0502-7486

Affiliations:

King Abdullah University of Science and Technology, Saudi Arabia
Nanjing University of Aeronautics & Astronautics, College of Automation Engineering, China (former)

According to our database¹, Yuhui Wang authored at least 26 papers between 2016 and 2026.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Bibliography

2026

Planning to Explore: Curiosity-Driven Planning for LLM Test Generation.

[BibT_eX]

[DOI]

CoRR, April, 2026

Efficient Morphology-Control Co-Design via Stackelberg Proximal Policy Optimization.

[BibT_eX]

[DOI]

CoRR, March, 2026

A Unified Framework for Rethinking Policy Divergence Measures in GRPO.

[BibT_eX]

[DOI]

CoRR, February, 2026

2025

Highly valued subgoal generation for efficient goal-conditioned reinforcement learning.

[BibT_eX]

[DOI]

Yao Li

Yuhui Wang

Xiaoyang Tan

Neural Networks, 2025

Mindstorms in Natural Language-Based Societies of Mind.

[BibT_eX]

[DOI]

Comput. Vis. Media, 2025

Directly Forecasting Belief for Reinforcement Learning with Delays.

[BibT_eX]

[DOI]

Proceedings of the Forty-second International Conference on Machine Learning, 2025

Scaling Value Iteration Networks to 5000 Layers for Extreme Long-Term Planning.

[BibT_eX]

[DOI]

Proceedings of the Forty-second International Conference on Machine Learning, 2025

2024

Highway Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, 2024

Variational Delayed Policy Optimization.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 37: Annual Conference on Neural Information Processing Systems 2024, 2024

Boosting Reinforcement Learning with Strongly Delayed Feedback Through Auxiliary Short Delays.

[BibT_eX]

[DOI]

Proceedings of the Forty-first International Conference on Machine Learning, 2024

Highway Value Iteration Networks.

[BibT_eX]

[DOI]

Proceedings of the Forty-first International Conference on Machine Learning, 2024

2023

SMIX(λ): Enhancing Centralized Value Functions for Cooperative Multiagent Reinforcement Learning.

[BibT_eX]

[DOI]

IEEE Trans. Neural Networks Learn. Syst., 2023

Guiding Online Reinforcement Learning with Action-Free Offline Pretraining.

[BibT_eX]

[DOI]

CoRR, 2023

Learning to Identify Critical States for Reinforcement Learning from Videos.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF International Conference on Computer Vision, 2023

2022

Alleviating the estimation bias of deep deterministic policy gradient via co-regularization.

[BibT_eX]

[DOI]

Pattern Recognit., 2022

A Cooperative-Competitive Multi-Agent Framework for Auto-bidding in Online Advertising.

[BibT_eX]

[DOI]

Proceedings of the WSDM '22: The Fifteenth ACM International Conference on Web Search and Data Mining, Virtual Event / Tempe, AZ, USA, February 21, 2022

2021

A Cooperative-Competitive Multi-Agent Framework for Auto-bidding in Online Advertising.

[BibT_eX]

[DOI]