Zhizhong Su

Orcid: 0000-0003-2312-9985

According to our database¹, Zhizhong Su authored at least 42 papers between 2015 and 2026.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Links

On csauthors.net:

Bibliography

2026

HoloMotion-1 Technical Report.

[BibT_eX]

[DOI]

CoRR, May, 2026

3D-Fixer: Coarse-to-Fine In-place Completion for 3D Scenes from a Single Image.

[BibT_eX]

[DOI]

CoRR, April, 2026

Scaling Sim-to-Real Reinforcement Learning for Robot VLAs with Generative 3D Worlds.

[BibT_eX]

[DOI]

CoRR, March, 2026

Spa3R: Predictive Spatial Field Modeling for 3D Visual Reasoning.

[BibT_eX]

[DOI]

CoRR, February, 2026

IRIS-SLAM: Unified Geo-Instance Representations for Robust Semantic Localization and Mapping.

[BibT_eX]

[DOI]

CoRR, February, 2026

HoloBrain-0 Technical Report.

[BibT_eX]

[DOI]

CoRR, February, 2026

RISE: Self-Improving Robot Policy with Compositional World Model.

[BibT_eX]

[DOI]

CoRR, February, 2026

MapDream: Task-Driven Map Learning for Vision-Language Navigation.

[BibT_eX]

[DOI]

CoRR, February, 2026

MonoDream: Monocular Vision-Language Navigation with Panoramic Dreaming.

[BibT_eX]

[DOI]

Proceedings of the Fortieth AAAI Conference on Artificial Intelligence, 2026

IGFuse: Interactive 3D Gaussian Scene Reconstruction via Multi-Scans Fusion.

[BibT_eX]

[DOI]

Proceedings of the Fortieth AAAI Conference on Artificial Intelligence, 2026

H-RDT: Human Manipulation Enhanced Bimanual Robotic Manipulation.

[BibT_eX]

[DOI]

Proceedings of the Fortieth AAAI Conference on Artificial Intelligence, 2026

2025

RecurGS: Interactive Scene Modeling via Discrete-State Recurrent Gaussian Fusion.

[BibT_eX]

[DOI]

CoRR, December, 2025

Motus: A Unified Latent Action World Model.

[BibT_eX]

[DOI]

CoRR, December, 2025

Progress-Think: Semantic Progress Reasoning for Vision-Language Navigation.

[BibT_eX]

[DOI]

CoRR, November, 2025

FSR-VLN: Fast and Slow Reasoning for Vision-Language Navigation with Hierarchical Multi-modal Scene Graph.

[BibT_eX]

[DOI]

CoRR, September, 2025

DreamLifting: A Plug-in Module Lifting MV Diffusion Models for 3D Asset Generation.

[BibT_eX]

[DOI]

CoRR, September, 2025

Uni3R: Unified 3D Reconstruction and Semantic Understanding via Generalizable Gaussian Splatting from Unposed Multi-View Images.

[BibT_eX]

[DOI]

CoRR, August, 2025

Theoretical Analysis of Relative Errors in Gradient Computations for Adversarial Attacks with CE Loss.

[BibT_eX]

[DOI]

CoRR, July, 2025

FineGrasp: Towards Robust Grasping for Delicate Objects.

[BibT_eX]

[DOI]

CoRR, July, 2025

EmbodiedGen: Towards a Generative 3D World Engine for Embodied Intelligence.

[BibT_eX]

[DOI]

CoRR, June, 2025

RoboTransfer: Geometry-Consistent Video Diffusion for Robotic Visual Policy Transfer.

[BibT_eX]

[DOI]

CoRR, May, 2025

SEM: Enhancing Spatial Understanding for Robust Robot Manipulation.

[BibT_eX]

[DOI]

CoRR, May, 2025

Aux-Think: Exploring Reasoning Strategies for Data-Efficient Vision-Language Navigation.

[BibT_eX]

[DOI]

CoRR, May, 2025

GeoFlow-SLAM: A Robust Tightly-Coupled RGBD-Inertial Fusion SLAM for Dynamic Legged Robotics.

[BibT_eX]

[DOI]

CoRR, March, 2025

DIPO: Dual-State Images Controlled Articulated Object Generation Powered by Diverse Data.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 38: Annual Conference on Neural Information Processing Systems 2025, 2025

GeoFlow-SLAM: A Robust Tightly-Coupled RGBD-Inertial and Legged Odometry Fusion SLAM for Dynamic Legged Robotics.

[BibT_eX]

[DOI]

Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems, 2025

BIP3D: Bridging 2D Images and 3D Perception for Embodied Intelligence.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

GaussTR: Foundation Model-Aligned Gaussian Transformer for Self-Supervised 3D Spatial Understanding.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

2024

Gaussian Object Carver: Object-Compositional Gaussian Splatting with surfaces completion.

[BibT_eX]

[DOI]

CoRR, 2024

GLS: Geometry-aware 3D Language Gaussian Splatting.

[BibT_eX]

[DOI]

CoRR, 2024

2023

Dataset construction method of cross-lingual summarization based on filtering and text augmentation.

[BibT_eX]

[DOI]

Dataset, March, 2023

Dataset construction method of cross-lingual summarization based on filtering and text augmentation.

[BibT_eX]

[DOI]

PeerJ Comput. Sci., 2023

Sparse4D v3: Advancing End-to-End 3D Detection and Tracking.

[BibT_eX]

[DOI]

CoRR, 2023

Sparse4D v2: Recurrent Temporal Fusion with Sparse Model.

[BibT_eX]

[DOI]

CoRR, 2023

2022

Sparse4D: Multi-view 3D Object Detection with Sparse Spatial-Temporal Fusion.

[BibT_eX]

[DOI]

CoRR, 2022

2021

HybridGazeNet: Geometric model guided Convolutional Neural Networks for gaze estimation.

[BibT_eX]

[DOI]

CoRR, 2021

A Stance Detection Approach Based on Generalized Autoregressive pretrained Language Model in Chinese Microblogs.

[BibT_eX]

[DOI]

Proceedings of the ICMLC 2021: 13th International Conference on Machine Learning and Computing, 2021

2020

Gaussian Vector: An Efficient Solution for Facial Landmark Detection.

[BibT_eX]

[DOI]

Proceedings of the Computer Vision - ACCV 2020 - 15th Asian Conference on Computer Vision, Kyoto, Japan, November 30, 2020

2019

A New Parallel Detection-Recognition Approach for End-to-End Scene Text Extraction.

[BibT_eX]

[DOI]

Proceedings of the 2019 International Conference on Document Analysis and Recognition, 2019

VarGFaceNet: An Efficient Variable Group Convolutional Neural Network for Lightweight Face Recognition.

[BibT_eX]

[DOI]

Proceedings of the 2019 IEEE/CVF International Conference on Computer Vision Workshops, 2019

2016

STAR-Net: A SpaTial Attention Residue Network for Scene Text Recognition.

[BibT_eX]

[DOI]

Proceedings of the British Machine Vision Conference 2016, 2016

2015

Conditional Random Fields as Recurrent Neural Networks.

[BibT_eX]

[DOI]

Shuai Zheng

Sadeep Jayasumana

Bernardino Romera-Paredes

Proceedings of the 2015 IEEE International Conference on Computer Vision, 2015

Zhizhong Su

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...