Qinglin Lu

Orcid: 0000-0002-4584-0826

According to our database¹, Qinglin Lu authored at least 83 papers between 2015 and 2026.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Links

On csauthors.net:

Bibliography

2026

SARA: Semantically Adaptive Relational Alignment for Video Diffusion Models.

[BibT_eX]

[DOI]

CoRR, May, 2026

Implicit Preference Alignment for Human Image Animation.

[BibT_eX]

[DOI]

CoRR, May, 2026

FaithfulFaces: Pose-Faithful Facial Identity Preservation for Text-to-Video Generation.

[BibT_eX]

[DOI]

CoRR, May, 2026

Refinement via Regeneration: Enlarging Modification Space Boosts Image Refinement in Unified Multimodal Models.

[BibT_eX]

[DOI]

CoRR, April, 2026

Meta-CoT: Enhancing Granularity and Generalization in Image Editing.

[BibT_eX]

[DOI]

CoRR, April, 2026

SOAR: Self-Correction for Optimal Alignment and Refinement in Diffusion Models.

[BibT_eX]

[DOI]

CoRR, April, 2026

OmniCamera: A Unified Framework for Multi-task Video Generation with Arbitrary Camera Control.

[BibT_eX]

[DOI]

CoRR, April, 2026

Hierarchical SVG Tokenization: Learning Compact Visual Programs for Scalable Vector Graphics Modeling.

[BibT_eX]

[DOI]

CoRR, April, 2026

VisionCreator-R1: A Reflection-Enhanced Native Visual-Generation Agentic Model.

[BibT_eX]

[DOI]

CoRR, March, 2026

EffectMaker: Unifying Reasoning and Generation for Customized Visual Effect Creation.

[BibT_eX]

[DOI]

CoRR, March, 2026

VisionCreator: A Native Visual-Generation Agentic Model with Understanding, Thinking, Planning and Creation.

[BibT_eX]

[DOI]

CoRR, March, 2026

Generative Visual Chain-of-Thought for Image Editing.

[BibT_eX]

[DOI]

CoRR, March, 2026

ChatUMM: Robust Context Tracking for Conversational Interleaved Generation.

[BibT_eX]

[DOI]

CoRR, February, 2026

OmniVideo-R1: Reinforcing Audio-visual Reasoning with Query Intention and Modality Attention.

[BibT_eX]

[DOI]

CoRR, February, 2026

Euphonium: Steering Video Flow Matching via Process Reward Gradient Guided Stochastic Dynamics.

[BibT_eX]

[DOI]

CoRR, February, 2026

Making Avatars Interact: Towards Text-Driven Human-Object Interaction for Controllable Talking Avatars.

[BibT_eX]

[DOI]

CoRR, February, 2026

TAG-MoE: Task-Aware Gating for Unified Generative Mixture-of-Experts.

[BibT_eX]

[DOI]

CoRR, January, 2026

TAGRPO: Boosting GRPO on Image-to-Video Generation with Direct Trajectory Alignment.

[BibT_eX]

[DOI]

CoRR, January, 2026

Rotate Your Character: Revisiting Video Diffusion Models for High-Quality 3D Character Generation.

[BibT_eX]

[DOI]

CoRR, January, 2026

Re-Align: Structured Reasoning-guided Alignment for In-Context Image Generation and Editing.

[BibT_eX]

[DOI]

CoRR, January, 2026

Phased One-Step Adversarial Equilibrium for Video Diffusion Models.

[BibT_eX]

[DOI]

Proceedings of the Fortieth AAAI Conference on Artificial Intelligence, 2026

2025

SoliReward: Mitigating Susceptibility to Reward Hacking and Annotation Noise in Video Generation Reward Models.

[BibT_eX]

[DOI]

CoRR, December, 2025

StreamAvatar: Streaming Diffusion Models for Real-Time Interactive Human Avatars.

[BibT_eX]

[DOI]

CoRR, December, 2025

ActAvatar: Temporally-Aware Precise Action Control for Talking Avatars.

[BibT_eX]

[DOI]

CoRR, December, 2025

USV: Unified Sparsification for Accelerating Video Diffusion Models.

[BibT_eX]

[DOI]

CoRR, December, 2025

Hunyuan-GameCraft-2: Instruction-following Interactive Game World Model.

[BibT_eX]

[DOI]

CoRR, November, 2025

JarvisEvo: Towards a Self-Evolving Photo Editing Agent with Synergistic Editor-Evaluator Optimization.

[BibT_eX]

[DOI]

CoRR, November, 2025

Harmony: Harmonizing Audio and Video Generation through Cross-Task Synergy.

[BibT_eX]

[DOI]

CoRR, November, 2025

Video Generation Models Are Good Latent Reward Models.

[BibT_eX]

[DOI]

CoRR, November, 2025

UniAVGen: Unified Audio and Video Generation with Asymmetric Cross-Modal Interactions.

[BibT_eX]

[DOI]

CoRR, November, 2025

UniGenBench++: A Unified Semantic Evaluation Benchmark for Text-to-Image Generation.

[BibT_eX]

[DOI]

CoRR, October, 2025

Bee: A High-Quality Corpus and Full-Stack Suite to Unlock Advanced Fully Open MLLMs.

[BibT_eX]

[DOI]

CoRR, October, 2025

Pack and Force Your Memory: Long-form and Consistent Video Generation.

[BibT_eX]

[DOI]

CoRR, October, 2025

Arbitrary Generative Video Interpolation.

[BibT_eX]

[DOI]

CoRR, October, 2025

HunyuanImage 3.0 Technical Report.

[BibT_eX]

[DOI]

CoRR, September, 2025

Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference.

[BibT_eX]

[DOI]

CoRR, September, 2025

PromptEnhancer: A Simple Approach to Enhance Text-to-Image Models via Chain-of-Thought Prompt Rewriting.

[BibT_eX]

[DOI]

CoRR, September, 2025

POSE: Phased One-Step Adversarial Equilibrium for Video Diffusion Models.

[BibT_eX]

[DOI]

CoRR, August, 2025

Pref-GRPO: Pairwise Preference Reward-based GRPO for Stable Text-to-Image Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, August, 2025

PersonaVlog: Personalized Multimodal Vlog Generation with Multi-Agent Collaboration and Iterative Self-Correction.

[BibT_eX]

[DOI]

CoRR, August, 2025

X-Omni: Reinforcement Learning Makes Discrete Autoregressive Image Generative Models Great Again.

[BibT_eX]

[DOI]

CoRR, July, 2025

Hunyuan-GameCraft: High-dynamic Interactive Game Video Generation with Hybrid History Condition.

[BibT_eX]

[DOI]

CoRR, June, 2025

HunyuanVideo-HOMA: Generic Human-Object Interaction in Multimodal Driven Human Animation.

[BibT_eX]

[DOI]

CoRR, June, 2025

PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement.

[BibT_eX]

[DOI]

CoRR, June, 2025

OmniV2V: Versatile Video Generation and Editing via Dynamic Content Manipulation.

[BibT_eX]

[DOI]

CoRR, June, 2025

HunyuanVideo-Avatar: High-Fidelity Audio-Driven Human Animation for Multiple Characters.

[BibT_eX]

[DOI]

CoRR, May, 2025

Hunyuan-Game: Industrial-grade Intelligent Game Creation Model.

[BibT_eX]

[DOI]

CoRR, May, 2025

HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation.

[BibT_eX]

[DOI]

CoRR, May, 2025

InstantCharacter: Personalize Any Characters with a Scalable Diffusion Transformer Framework.

[BibT_eX]

[DOI]

CoRR, April, 2025

LoRA-Composer: Leveraging Low-Rank Adaptation for Multi-Concept Customization in Training-Free Diffusion Models.

[BibT_eX]

[DOI]

IEEE Trans. Image Process., 2025

HOMA: Towards Generic Human-Object Interaction in Multimodal Driven Human Animation with Weak Conditions.

[BibT_eX]

[DOI]

Proceedings of the SIGGRAPH Asia 2025 Conference Papers, 2025

Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 38: Annual Conference on Neural Information Processing Systems 2025, 2025

DialogGen: Multi-modal Interactive Dialogue System with Multi-turn Text-Image Generation.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics: NAACL 2025, Albuquerque, New Mexico, USA, April 29, 2025

Audio-Visual Controlled Video Diffusion with Masked Selective State Spaces Modeling for Natural Talking Head Generation.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF International Conference on Computer Vision, 2025

FireEdit: Fine-grained Instruction-based Image Editing via Region-aware Vision Language Model.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

HunyuanPortrait: Implicit Condition Control for Enhanced Portrait Animation.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

Sonic: Shifting Focus to Global Audio Perception in Portrait Animation.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

Concept-Edge Fusion: Background Generation for Product Presentation Based on Text-to-Image Model.

[BibT_eX]

[DOI]

Proceedings of the Computational Visual Media - 13th International Conference, 2025

Local Conditional Controlling for Text-to-Image Diffusion Models.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Ninth AAAI Conference on Artificial Intelligence, 2025

2024

HunyuanVideo: A Systematic Framework For Large Video Generative Models.

[BibT_eX]

[DOI]

CoRR, 2024

Searching Priors Makes Text-to-Video Synthesis Better.

[BibT_eX]

[DOI]

CoRR, 2024

Hunyuan-DiT: A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding.

[BibT_eX]

[DOI]

CoRR, 2024

LoRA-Composer: Leveraging Low-Rank Adaptation for Multi-Concept Customization in Training-Free Diffusion Models.

[BibT_eX]

[DOI]

CoRR, 2024

DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation.

[BibT_eX]

[DOI]

CoRR, 2024

2023

An Optimized Framework for Matrix Factorization on the New Sunway Many-core Platform.

[BibT_eX]

[DOI]

ACM Trans. Archit. Code Optim., June, 2023

Publisher Correction: xMath2.0: a high-performance extended math library for SW26010-Pro many-core processor.

[BibT_eX]

[DOI]

CCF Trans. High Perform. Comput., March, 2023

xMath2.0: a high-performance extended math library for SW26010-Pro many-core processor.

[BibT_eX]

[DOI]

CCF Trans. High Perform. Comput., March, 2023

Local Conditional Controlling for Text-to-Image Diffusion Models.

[BibT_eX]

[DOI]

CoRR, 2023

Smooth Video Synthesis with Noise Constraints on Diffusion Models for One-shot Video Tuning.

[BibT_eX]

[DOI]

CoRR, 2023

IRB-5-CA Net: A Lightweight, Deep Learning-Based Approach to Wheat Seed Identification.

[BibT_eX]

[DOI]

IEEE Access, 2023

GFFT: a Task Graph Based Fast Fourier Transform Optimization Framework.

[BibT_eX]

[DOI]

Proceedings of the 52nd International Conference on Parallel Processing, 2023

2022

Tencent AVS: A Holistic Ads Video Dataset for Multi-Modal Scene Segmentation.

[BibT_eX]

[DOI]

IEEE Access, 2022

2.5 Million-Atom Ab Initio Electronic-Structure Simulation of Complex Metallic Heterostructures with DGDFT.

[BibT_eX]

[DOI]

Proceedings of the SC22: International Conference for High Performance Computing, 2022

Multi-modal Segment Assemblage Network for Ad Video Editing with Importance-Coherence Reward.

[BibT_eX]

[DOI]

Proceedings of the Computer Vision - ACCV 2022, 2022

2021

Identification Method of Wheat Cultivars by Using a Convolutional Neural Network Combined with Images of Multiple Growth Periods of Wheat.

[BibT_eX]

[DOI]

Symmetry, 2021

Overview of Tencent Multi-modal Ads Video Understanding Challenge.

[BibT_eX]

[DOI]

CoRR, 2021

Better Learning Shot Boundary Detection via Multi-task.

[BibT_eX]

[DOI]

Haoxin Zhang

Zhimin Li

Qinglin Lu

Proceedings of the MM '21: ACM Multimedia Conference, Virtual Event, China, October 20, 2021

Overview of Tencent Multi-modal Ads Video Understanding.

[BibT_eX]

[DOI]

Proceedings of the MM '21: ACM Multimedia Conference, Virtual Event, China, October 20, 2021

2019

Context-free grammars, generating functions and combinatorial arrays.

[BibT_eX]

[DOI]

Bao-Xuan Zhu

Yeong-Nan Yeh

Qinglin Lu

Eur. J. Comb., 2019

2015

Entire reflective object surface structure understanding based on reflection motion estimation.

[BibT_eX]

[DOI]

Pattern Recognit. Lett., 2015

Manufactured object sub-segmentation based on reflection motion estimation.

[BibT_eX]

[DOI]

Proceedings of the 14th IAPR International Conference on Machine Vision Applications, 2015

Local surface curvature analysis based on reflection estimation.

[BibT_eX]

[DOI]

Proceedings of the Seventh International Conference on Digital Image Processing, 2015

Entire Reflective Object Surface Structure Understanding.

[BibT_eX]

[DOI]

Proceedings of the British Machine Vision Conference 2015, 2015

Qinglin Lu

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...