Zhizheng Zhang

Affiliations:

GalBot, Beijing, China

According to our database¹, Zhizheng Zhang authored at least 22 papers between 2024 and 2026.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Links

On csauthors.net:

Bibliography

2026

NavGSim: High-Fidelity Gaussian Splatting Simulator for Large-Scale Navigation.

[BibT_eX]

[DOI]

CoRR, March, 2026

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning.

[BibT_eX]

[DOI]

CoRR, March, 2026

SPAN-Nav: Generalized Spatial Awareness for Versatile Vision-Language Navigation.

[BibT_eX]

[DOI]

CoRR, March, 2026

SimRecon: SimReady Compositional Scene Reconstruction from Real Videos.

[BibT_eX]

[DOI]

CoRR, March, 2026

LDA-1B: Scaling Latent Dynamics Action Model via Universal Embodied Data Ingestion.

[BibT_eX]

[DOI]

CoRR, February, 2026

Any3D-VLA: Enhancing VLA Robustness via Diverse Point Clouds.

[BibT_eX]

[DOI]

CoRR, February, 2026

2025

StereoVLA: Enhancing Vision-Language-Action Models with Stereo Vision.

[BibT_eX]

[DOI]

CoRR, December, 2025

RoboCOIN: An Open-Sourced Bimanual Robotic Data COllection for INtegrated Manipulation.

[BibT_eX]

[DOI]

CoRR, November, 2025

UrbanVLA: A Vision-Language-Action Model for Urban Micromobility.

[BibT_eX]

[DOI]

CoRR, October, 2025

TrackVLA++: Unleashing Reasoning and Memory Capabilities in VLA Models for Embodied Visual Tracking.

[BibT_eX]

[DOI]

CoRR, October, 2025

MM-Nav: Multi-View VLA Model for Robust Visual Navigation via Multi-Expert Learning.

[BibT_eX]

[DOI]

CoRR, October, 2025

CL3R: 3D Reconstruction and Contrastive Learning for Enhanced Robotic Manipulation Representations.

[BibT_eX]

[DOI]

CoRR, July, 2025

DreamVLA: A Vision-Language-Action Model Dreamed with Comprehensive World Knowledge.

[BibT_eX]

[DOI]

CoRR, July, 2025

TrackVLA: Embodied Visual Tracking in the Wild.

[BibT_eX]

[DOI]

CoRR, May, 2025

GraspVLA: a Grasping Foundation Model Pre-trained on Billion-scale Synthetic Action Data.

[BibT_eX]

[DOI]

CoRR, May, 2025

FetchBot: Object Fetching in Cluttered Shelves via Zero-Shot Sim2Real.

[BibT_eX]

[DOI]

CoRR, February, 2025

SoFar: Language-Grounded Orientation Bridges Spatial Reasoning and Object Manipulation.

[BibT_eX]

[DOI]

CoRR, February, 2025

DexVLG: Dexterous Vision-Language-Grasp Model at Scale.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF International Conference on Computer Vision, 2025

Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

2024

Uni-NaVid: A Video-based Vision-Language-Action Model for Unifying Embodied Navigation Tasks.

[BibT_eX]

[DOI]

CoRR, 2024

NaVid: Video-based VLM Plans the Next Step for Vision-and-Language Navigation.

[BibT_eX]

[DOI]

Proceedings of the Robotics: Science and Systems XX, 2024

Open6DOR: Benchmarking Open-instruction 6-DoF Object Rearrangement and A VLM-based Approach.

[BibT_eX]

[DOI]

Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems, 2024

Zhizheng Zhang

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...