Guozheng Ma

Orcid: 0000-0003-1884-6103

According to our database¹, Guozheng Ma authored at least 20 papers between 2013 and 2026.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Links

On csauthors.net:

Bibliography

2026

STRIDE: Learnable Stepwise Language Feedback for LLM Reasoning.

[BibT_eX]

[DOI]

CoRR, May, 2026

What Makes Value Learning Efficient in Residual Reinforcement Learning?

[BibT_eX]

[DOI]

CoRR, February, 2026

Language-based Trial and Error Falls Behind in the Era of Experience.

[BibT_eX]

[DOI]

CoRR, January, 2026

Towards Reliable Medical LLMs: Benchmarking and Enhancing Confidence Estimation of Large Language Models in Medical Consultation.

[BibT_eX]

[DOI]

CoRR, January, 2026

Consistency-Regularized Multi-Stage Joint-Perception Graph Fuzzy Clustering Algorithm.

[BibT_eX]

[DOI]

Neurocomputing, 2026

2025

A Comprehensive Survey of Data Augmentation in Visual Reinforcement Learning.

[BibT_eX]

[DOI]

Int. J. Comput. Vis., October, 2025

Rethinking the Role of Dynamic Sparse Training for Scalable Deep Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, October, 2025

UltraHorizon: Benchmarking Agent Capabilities in Ultra Long-Horizon Scenarios.

[BibT_eX]

[DOI]

CoRR, September, 2025

MeRF: Motivation-enhanced Reinforcement Finetuning for Large Reasoning Models.

[BibT_eX]

[DOI]

CoRR, June, 2025

Plasticine: Accelerating Research in Plasticity-Motivated Deep Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, April, 2025

Are Large Language Models Really Robust to Word-Level Perturbations?

[BibT_eX]

[DOI]

Trans. Mach. Learn. Res., 2025

Network Sparsity Unlocks the Scaling Potential of Deep Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Forty-second International Conference on Machine Learning, 2025

Mastering Massive Multi-Task Reinforcement Learning via Mixture-of-Expert Decision Transformer.

[BibT_eX]

[DOI]

Proceedings of the Forty-second International Conference on Machine Learning, 2025

Faster and Better 3D Splatting via Group Training.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF International Conference on Computer Vision, 2025

2024

Step-On-Feet Tuning: Scaling Self-Alignment of LLMs via Bootstrapping.

[BibT_eX]

[DOI]

CoRR, 2024

Revisiting Plasticity in Visual Reinforcement Learning: Data, Modules and Training Stages.

[BibT_eX]

[DOI]

Proceedings of the Twelfth International Conference on Learning Representations, 2024

Normalization Enhances Generalization in Visual Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the 23rd International Conference on Autonomous Agents and Multiagent Systems, 2024

2023

Learning Better with Less: Effective Augmentation for Sample-Efficient Visual Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 36: Annual Conference on Neural Information Processing Systems 2023, 2023

2022

Don't Touch What Matters: Task-Aware Lipschitz Data Augmentation for Visual Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Thirty-First International Joint Conference on Artificial Intelligence, 2022

2013

An optimization scheme for highway emergency dispatching management.

[BibT_eX]

[DOI]

Proceedings of the Ninth International Conference on Natural Computation, 2013

Guozheng Ma

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...