Pengxiang Ding

Orcid: 0000-0002-4049-7467

According to our database¹, Pengxiang Ding authored at least 50 papers between 2021 and 2025.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Links

On csauthors.net:

Bibliography

2025

Unified Diffusion VLA: Vision-Language-Action Model via Joint Discrete Denoising Diffusion Process.

[BibT_eX]

[DOI]

CoRR, November, 2025

Iterative Refinement of Flow Policies in Probability Space for Online Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, October, 2025

VLA^2: Empowering Vision-Language-Action Models with an Agentic Framework for Unseen Concept Manipulation.

[BibT_eX]

[DOI]

CoRR, October, 2025

Spatial Forcing: Implicit Spatial Representation Alignment for Vision-language-action Model.

[BibT_eX]

[DOI]

CoRR, October, 2025

Towards a Unified Understanding of Robot Manipulation: A Comprehensive Survey.

[BibT_eX]

[DOI]

CoRR, October, 2025

VCoT-Grasp: Grasp Foundation Models with Visual Chain-of-Thought Reasoning for Language-driven Grasp Generation.

[BibT_eX]

[DOI]

CoRR, October, 2025

VLA-RFT: Vision-Language-Action Reinforcement Fine-tuning with Verified Rewards in World Simulators.

[BibT_eX]

[DOI]

CoRR, October, 2025

Robust Online Residual Refinement via Koopman-Guided Dynamics Modeling.

[BibT_eX]

[DOI]

CoRR, September, 2025

TrajBooster: Boosting Humanoid Whole-Body Manipulation via Trajectory-Centric Learning.

[BibT_eX]

[DOI]

CoRR, September, 2025

VLA-Adapter: An Effective Paradigm for Tiny-Scale Vision-Language-Action Model.

[BibT_eX]

[DOI]

CoRR, September, 2025

Long-VLA: Unleashing Long-Horizon Capability of Vision Language Action Model for Robot Manipulation.

[BibT_eX]

[DOI]

CoRR, August, 2025

ReconVLA: Reconstructive Vision-Language-Action Model as Effective Robot Perceiver.

[BibT_eX]

[DOI]

CoRR, August, 2025

CEED-VLA: Consistency Vision-Language-Action Model with Early-Exit Decoding.

[BibT_eX]

[DOI]

CoRR, June, 2025

RationalVLA: A Rational Vision-Language-Action Model with Dual System.

[BibT_eX]

[DOI]

CoRR, June, 2025

SSR: Enhancing Depth Perception in Vision-Language Models via Rationale-Guided Spatial Reasoning.

[BibT_eX]

[DOI]

CoRR, May, 2025

Unveiling the Potential of Vision-Language-Action Models with Open-Ended Multimodal Instructions.

[BibT_eX]

[DOI]

CoRR, May, 2025

OpenHelix: A Short Survey, Empirical Analysis, and Open-Source Dual-System VLA Model for Robotic Manipulation.

[BibT_eX]

[DOI]

CoRR, May, 2025

Rethinking Target Label Conditioning in Adversarial Attacks: A 2D Tensor-Guided Generative Approach.

[BibT_eX]

[DOI]

CoRR, April, 2025

Unicorn: Text-Only Data Synthesis for Vision Language Model Training.

[BibT_eX]

[DOI]

CoRR, March, 2025

Exploring the Evolution of Physics Cognition in Video Generation: A Survey.

[BibT_eX]

[DOI]

CoRR, March, 2025

Accelerating Vision-Language-Action Model Integrated with Action Chunking via Parallel Decoding.

[BibT_eX]

[DOI]

CoRR, March, 2025

Humanoid-VLA: Towards Universal Humanoid Control with Visual Integration.

[BibT_eX]

[DOI]

CoRR, February, 2025

Rethinking Latent Representations in Behavior Cloning: An Information Bottleneck Approach for Robot Manipulation.

[BibT_eX]

[DOI]

CoRR, February, 2025

Enhancing Adversarial Transferability via Component-Wise Augmentation Method.

[BibT_eX]

[DOI]

CoRR, January, 2025

MoRE: Unlocking Scalability in Reinforcement Learning for Quadruped Vision-Language-Action Models.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Robotics and Automation, 2025

Quart-Online: Latency-Free Multimodal Large Language Model for Quadruped Robot Learning.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Robotics and Automation, 2025

ReinboT: Amplifying Robot Visual-Language Manipulation with Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Forty-second International Conference on Machine Learning, 2025

Score-Based Diffusion Policy Compatible with Reinforcement Learning via Optimal Transport.

[BibT_eX]

[DOI]

Proceedings of the Forty-second International Conference on Machine Learning, 2025

Rethinking Latent Redundancy in Behavior Cloning: An Information Bottleneck Approach for Robot Manipulation.

[BibT_eX]

[DOI]

Proceedings of the Forty-second International Conference on Machine Learning, 2025

VLAS: Vision-Language-Action Model with Speech Instructions for Customized Robot Manipulation.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

GEVRM: Goal-Expressive Video Generation Model For Robust Visual Manipulation.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference.

[BibT_eX]

[DOI]

Proceedings of the AAAI-25, Sponsored by the Association for the Advancement of Artificial Intelligence, February 25, 2025

2024

Instance-Incremental Scene Graph Generation From Real-World Point Clouds via Normalizing Flows.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., February, 2024

DHRNet: A Dual-path Hierarchical Relation Network for multi-person pose estimation.

[BibT_eX]

[DOI]

Knowl. Based Syst., 2024

QUART-Online: Latency-Free Large Multimodal Language Model for Quadruped Robot Learning.

[BibT_eX]

[DOI]

CoRR, 2024

Score and Distribution Matching Policy: Advanced Accelerated Visuomotor Policies via Matched Distillation.

[BibT_eX]

[DOI]

CoRR, 2024

CARP: Visuomotor Policy Learning via Coarse-to-Fine Autoregressive Prediction.

[BibT_eX]

[DOI]

CoRR, 2024

Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration.

[BibT_eX]

[DOI]

CoRR, 2024

RL2AC: Reinforcement Learning-based Rapid Online Adaptive Control for Legged Robot Robust Locomotion.

[BibT_eX]

[DOI]

Proceedings of the Robotics: Science and Systems XX, 2024

ProFD: Prompt-Guided Feature Disentangling for Occluded Person Re-Identification.

[BibT_eX]

[DOI]

Proceedings of the 32nd ACM International Conference on Multimedia, MM 2024, Melbourne, VIC, Australia, 28 October 2024, 2024

GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot.

[BibT_eX]

[DOI]

Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems, 2024

PiTe: Pixel-Temporal Alignment for Large Video-Language Model.

[BibT_eX]

[DOI]

Proceedings of the Computer Vision - ECCV 2024, 2024

QUAR-VLA: Vision-Language-Action Model for Quadruped Robots.

[BibT_eX]

[DOI]

Proceedings of the Computer Vision - ECCV 2024, 2024

Expressive Forecasting of 3D Whole-Body Human Motions.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Eighth AAAI Conference on Artificial Intelligence, 2024

2023

QUAR-VLA: Vision-Language-Action Model for Quadruped Robots.

[BibT_eX]

[DOI]

CoRR, 2023

2022

Towards More Realistic Human Motion Prediction With Attention to Motion Coordination.

[BibT_eX]

[DOI]

Pengxiang Ding

Jianqin Yin

IEEE Trans. Circuits Syst. Video Technol., 2022

DC-net: Dual-Consistency semi-supervised learning for 3D left atrium segmentation from MRI.

[BibT_eX]

[DOI]

Biomed. Signal Process. Control., 2022

2021

TrajectoryCNN: A New Spatio-Temporal Feature Learning Network for Human Motion Prediction.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., 2021

Uncertainty-aware Human Motion Prediction.

[BibT_eX]

[DOI]

Pengxiang Ding

Jianqin Yin

CoRR, 2021

An Attractor-Guided Neural Networks for Skeleton-Based Human Motion Prediction.

[BibT_eX]

[DOI]

Pengxiang Ding

Jianqin Yin

CoRR, 2021

Pengxiang Ding

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...