Muning Wen

Orcid: 0009-0000-7868-1262

According to our database¹, Muning Wen authored at least 32 papers between 2021 and 2025.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Links

On csauthors.net:

Bibliography

2025

RDHNet: addressing rotational and permutational symmetries in continuous multi-agent systems.

[BibT_eX]

[DOI]

Frontiers Comput. Sci., November, 2025

PARL-MT: Learning to Call Functions in Multi-Turn Conversation with Progress Awareness.

[BibT_eX]

[DOI]

CoRR, September, 2025

MobileUse: A GUI Agent with Hierarchical Reflection for Autonomous Mobile Operation.

[BibT_eX]

[DOI]

CoRR, July, 2025

A Survey of AI Agent Protocols.

[BibT_eX]

[DOI]

CoRR, April, 2025

MARFT: Multi-Agent Reinforcement Fine-Tuning.

[BibT_eX]

[DOI]

CoRR, April, 2025

Learning Humanoid Standing-up Control across Diverse Postures.

[BibT_eX]

[DOI]

CoRR, February, 2025

PMAT: Optimizing Action Generation Order in Multi-Agent Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the 24th International Conference on Autonomous Agents and Multiagent Systems, 2025

Robust Function-Calling for On-Device Language Model via Function Masking.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

Robust Gymnasium: A Unified Modular Benchmark for Robust Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

HammerBench: Fine-Grained Function-Calling Evaluation in Real Mobile Assistant Scenarios.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics, 2025

Autonomous Goal Detection and Cessation in Reinforcement Learning: A Case Study on Source Term Estimation.

[BibT_eX]

[DOI]

Proceedings of the AAAI-25, Sponsored by the Association for the Advancement of Artificial Intelligence, February 25, 2025

2024

Safe Multiagent Learning With Soft Constrained Policy Optimization in Real Robot Control.

[BibT_eX]

[DOI]

IEEE Trans. Ind. Informatics, September, 2024

RoMAT: Role-based multi-agent transformer for generalizable heterogeneous cooperation.

[BibT_eX]

[DOI]

Neural Networks, 2024

HammerBench: Fine-Grained Function-Calling Evaluation in Real Mobile Device Scenarios.

[BibT_eX]

[DOI]

CoRR, 2024

OpenR: An Open Source Framework for Advanced Reasoning with Large Language Models.

[BibT_eX]

[DOI]

CoRR, 2024

Hammer: Robust Function-Calling for On-Device Language Models via Function Masking.

[BibT_eX]

[DOI]

CoRR, 2024

P3: A Policy-Driven, Pace-Adaptive, and Diversity-Promoted Framework for Optimizing LLM Training.

[BibT_eX]

[DOI]

CoRR, 2024

Reinforcing Language Agents via Policy Optimization with Action Decomposition.

[BibT_eX]

[DOI]

CoRR, 2024

Entropy-Regularized Token-Level Policy Optimization for Large Language Models.

[BibT_eX]

[DOI]

CoRR, 2024

TRAD: Enhancing LLM Agents with Step-Wise Thought Retrieval and Aligned Decision.

[BibT_eX]

[DOI]

Proceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval, 2024

Reinforcing LLM Agents via Policy Optimization with Action Decomposition.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 38: Annual Conference on Neural Information Processing Systems 2024, 2024

AlphaZero-Like Tree-Search can Guide Large Language Model Decoding and Training.

[BibT_eX]

[DOI]

Ziyu Wan

Xidong Feng

Muning Wen

Stephen Marcus McAleer

Ying Wen

Weinan Zhang

Jun Wang

Proceedings of the Forty-first International Conference on Machine Learning, 2024

2023

Large sequence models for sequential decision-making: a survey.

[BibT_eX]

[DOI]

Frontiers Comput. Sci., December, 2023

Offline Pre-trained Multi-agent Decision Transformer.

[BibT_eX]

[DOI]

Mach. Intell. Res., April, 2023

MALib: A Parallel Framework for Population-based Multi-agent Reinforcement Learning.

[BibT_eX]

[DOI]

J. Mach. Learn. Res., 2023

Alphazero-like Tree-Search can Guide Large Language Model Decoding and Training.

[BibT_eX]

[DOI]

CoRR, 2023

2022

Multi-Agent Reinforcement Learning is a Sequence Modeling Problem.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 35: Annual Conference on Neural Information Processing Systems 2022, 2022

Trust Region Policy Optimisation in Multi-Agent Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Tenth International Conference on Learning Representations, 2022

2021

Offline Pre-trained Multi-Agent Decision Transformer: One Big Sequence Model Tackles All SMAC Tasks.

[BibT_eX]

[DOI]

CoRR, 2021

Multi-Agent Constrained Policy Optimisation.

[BibT_eX]

[DOI]

CoRR, 2021

MALib: A Parallel Framework for Population-based Multi-agent Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, 2021

Settling the Variance of Multi-Agent Policy Gradients.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 34: Annual Conference on Neural Information Processing Systems 2021, 2021

Muning Wen

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...