Jiabing Yang

Orcid: 0009-0009-9406-5545

According to our database¹, Jiabing Yang authored at least 18 papers between 2025 and 2026.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of three.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Links

On csauthors.net:

Bibliography

2026

Omni-DeepSearch: A Benchmark for Audio-Driven Omni-Modal Deep Search.

[BibT_eX]

[DOI]

CoRR, May, 2026

Beyond the All-in-One Agent: Benchmarking Role-Specialized Multi-Agent Collaboration in Enterprise Workflows.

[BibT_eX]

[DOI]

CoRR, May, 2026

Multi-View Video Diffusion Policy: A 3D Spatio-Temporal-Aware Video Action Model.

[BibT_eX]

[DOI]

CoRR, April, 2026

UAOR: Uncertainty-aware Observation Reinjection for Vision-Language-Action Models.

[BibT_eX]

[DOI]

CoRR, February, 2026

Beyond Closed-Pool Video Retrieval: A Benchmark and Agent Framework for Real-World Video Search and Moment Localization.

[BibT_eX]

[DOI]

CoRR, February, 2026

PaperX: A Unified Framework for Multimodal Academic Presentation Generation with Scholar DAG.

[BibT_eX]

[DOI]

CoRR, February, 2026

BridgeV2W: Bridging Video Generation Models to Embodied World Models via Embodiment Masks.

[BibT_eX]

[DOI]

CoRR, February, 2026

ShotFinder: Imagination-Driven Open-Domain Video Shot Retrieval via Web Search.

[BibT_eX]

[DOI]

CoRR, January, 2026

ToolWeaver: Weaving Collaborative Semantics for Scalable Tool Use in Large Language Models.

[BibT_eX]

[DOI]

CoRR, January, 2026

BrowserAgent: Building Web Agents with Human-Inspired Web Browsing Actions.

[BibT_eX]

[DOI]

Trans. Mach. Learn. Res., 2026

Privacy preserving person re-identification via anonymizing diffusion model.

[BibT_eX]

[DOI]

Pattern Recognit., 2026

2025

AudioMarathon: A Comprehensive Benchmark for Long-Context Audio Understanding and Efficiency in Audio LLMs.

[BibT_eX]

[DOI]

CoRR, October, 2025

EgoDemoGen: Novel Egocentric Demonstration Generation Enables Viewpoint-Robust Manipulation.

[BibT_eX]

[DOI]

CoRR, September, 2025

Prune2Drive: A Plug-and-Play Framework for Accelerating Vision-Language Models in Autonomous Driving.

[BibT_eX]

[DOI]

CoRR, August, 2025

DTPA: Dynamic Token-level Prefix Augmentation for Controllable Text Generation.

[BibT_eX]

[DOI]

CoRR, August, 2025

IKOD: Mitigating Visual Attention Degradation in Large Vision-Language Models.

[BibT_eX]

[DOI]

CoRR, August, 2025

EC-Flow: Enabling Versatile Robotic Manipulation from Action-Unlabeled Videos via Embodiment-Centric Flow.

[BibT_eX]

[DOI]

CoRR, July, 2025

EC-Flow: Enabling Versatile Robotic Manipulation from Action-Unlabeled Videos via Embodiment-Centric Flow.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF International Conference on Computer Vision, 2025

Jiabing Yang

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...