Dave Zhenyu Chen

Orcid: 0000-0002-3883-1905

According to our database¹, Dave Zhenyu Chen authored at least 20 papers between 2020 and 2026.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Links

On csauthors.net:

Bibliography

2026

AnchorSplat: Feed-Forward 3D Gaussian Splatting with 3D Geometric Priors.

[BibT_eX]

[DOI]

CoRR, April, 2026

Reliev3R: Relieving Feed-forward Reconstruction from Multi-View Geometric Annotations.

[BibT_eX]

[DOI]

CoRR, April, 2026

GAP-MLLM: Geometry-Aligned Pre-training for Activating 3D Spatial Perception in Multimodal Large Language Models.

[BibT_eX]

[DOI]

CoRR, March, 2026

VGGT-Det: Mining VGGT Internal Priors for Sensor-Geometry-Free Multi-View Indoor 3D Object Detection.

[BibT_eX]

[DOI]

CoRR, March, 2026

Map2Thought: Explicit 3D Spatial Reasoning via Metric Cognitive Maps.

[BibT_eX]

[DOI]

Eduardo Pérez-Pellitero

Youngkyoon Jang

CoRR, January, 2026

2025

WPT: World-to-Policy Transfer via Online World Model Distillation.

[BibT_eX]

[DOI]

CoRR, November, 2025

Does Your 3D Encoder Really Work? When Pretrain-SFT from 2D VLMs Meets 3D VLMs.

[BibT_eX]

[DOI]

CoRR, June, 2025

Taming Video Diffusion Prior with Scene-Grounding Guidance for 3D Gaussian Splatting from Sparse Inputs.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

2024

Grounding Natural Language to 3D Scenes.

[BibT_eX]

[DOI]

Dave Zhenyu Chen

PhD thesis, 2024

When LLMs step into the 3D World: A Survey and Meta-Analysis of 3D Tasks via Multi-modal Large Language Models.

[BibT_eX]

[DOI]

Victor Adrian Prisacariu

CoRR, 2024

EchoScene: Indoor Scene Generation via Information Echo Over Scene Graph Diffusion.

[BibT_eX]

[DOI]

Proceedings of the Computer Vision - ECCV 2024, 2024

SceneTex: High-Quality Texture Synthesis for Indoor Scenes via Diffusion Priors.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2024

2023

Federated Learning via Decentralized Dataset Distillation in Resource-Constrained Edge Environments.

[BibT_eX]

[DOI]

Proceedings of the International Joint Conference on Neural Networks, 2023

Text2Tex: Text-driven Texture Synthesis via Diffusion Models.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF International Conference on Computer Vision, 2023

UniT3D: A Unified Transformer for 3D Dense Captioning and Visual Grounding.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF International Conference on Computer Vision, 2023

Generating Context-Aware Natural Answers for Questions in 3D Scenes.

[BibT_eX]

[DOI]

Mohammed Munzer Dwedari

Matthias Nießner

Dave Zhenyu Chen

Proceedings of the 34th British Machine Vision Conference 2023, 2023

2022

D<sup>3</sup>Net: A Unified Speaker-Listener Architecture for 3D Dense Captioning and Visual Grounding.

[BibT_eX]

[DOI]

Proceedings of the Computer Vision - ECCV 2022, 2022

2021

D3Net: A Speaker-Listener Architecture for Semi-supervised Dense Captioning and Visual Grounding in RGB-D Scans.

[BibT_eX]

[DOI]

CoRR, 2021

Scan2Cap: Context-Aware Dense Captioning in RGB-D Scans.

[BibT_eX]

[DOI]

Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2021

2020

ScanRefer: 3D Object Localization in RGB-D Scans Using Natural Language.

[BibT_eX]

[DOI]

Dave Zhenyu Chen

Angel X. Chang

Matthias Nießner

Proceedings of the Computer Vision - ECCV 2020, 2020

Dave Zhenyu Chen

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...