Harry Yang

According to our database¹, Harry Yang authored at least 37 papers between 2014 and 2025.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of three.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Links

On csauthors.net:

Bibliography

2025

Enhancing Diffusion-based Restoration Models via Difficulty-Adaptive Reinforcement Learning with IQA Reward.

[BibT_eX]

[DOI]

CoRR, November, 2025

CML-Bench: A Framework for Evaluating and Enhancing LLM-Powered Movie Scripts Generation.

[BibT_eX]

[DOI]

CoRR, October, 2025

Deforming Videos to Masks: Flow Matching for Referring Video Segmentation.

[BibT_eX]

[DOI]

CoRR, October, 2025

Go with Your Gut: Scaling Confidence for Autoregressive Image Generation.

[BibT_eX]

[DOI]

CoRR, September, 2025

TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head Synthesis.

[BibT_eX]

[DOI]

CoRR, August, 2025

Hierarchical Fine-grained Preference Optimization for Physically Plausible Video Generation.

[BibT_eX]

[DOI]

CoRR, August, 2025

Meta-Learning for Speeding Up Large Model Inference in Decentralized Environments.

[BibT_eX]

[DOI]

CoRR, August, 2025

Follow-Your-Shape: Shape-Aware Image Editing via Trajectory-Guided Region Control.

[BibT_eX]

[DOI]

CoRR, August, 2025

Enhancing Vector Quantization with Distributional Matching: A Theoretical and Empirical Study.

[BibT_eX]

[DOI]

CoRR, June, 2025

When Semantics Mislead Vision: Mitigating Large Multimodal Models Hallucinations in Scene Text Spotting and Understanding.

[BibT_eX]

[DOI]

CoRR, June, 2025

Model Reveals What to Cache: Profiling-Based Feature Reuse for Video Diffusion Models.

[BibT_eX]

[DOI]

CoRR, April, 2025

Temporal Regularization Makes Your Video Generator Stronger.

[BibT_eX]

[DOI]

CoRR, March, 2025

Niagara: Normal-Integrated Geometric Affine Field for Scene Reconstruction from a Single View.

[BibT_eX]

[DOI]

CoRR, March, 2025

VideoMerge: Towards Training-free Long Video Generation.

[BibT_eX]

[DOI]

Siyang Zhang

Harry Yang

Ser-Nam Lim

CoRR, March, 2025

LightGen: Efficient Image Generation through Knowledge Distillation and Direct Preference Optimization.

[BibT_eX]

[DOI]

CoRR, March, 2025

VFX Creator: Animated Visual Effect Generation with Controllable Diffusion Transformer.

[BibT_eX]

[DOI]

CoRR, February, 2025

Encrypted Large Model Inference: The Equivariant Encryption Paradigm.

[BibT_eX]

[DOI]

CoRR, February, 2025

Intervening Anchor Token: Decoding Strategy in Alleviating Hallucinations for MLLMs.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

Unveiling the Ignorance of MLLMs: Seeing Clearly, Answering Incorrectly.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

2024

Next Patch Prediction for Autoregressive Visual Generation.

[BibT_eX]

[DOI]

CoRR, 2024

VideoGen-of-Thought: A Collaborative Framework for Multi-Shot Video Generation.

[BibT_eX]

[DOI]

CoRR, 2024

OmniCreator: Self-Supervised Unified Generation with Universal Editing.

[BibT_eX]

[DOI]

CoRR, 2024

DreamDance: Animating Human Images by Enriching 3D Geometry Cues from 2D Poses.

[BibT_eX]

[DOI]

CoRR, 2024

Meta-Learning for Speeding Up Large Model Inference in Decentralized Environments.

[BibT_eX]

[DOI]

CoRR, 2024

Model Agnostic Hybrid Sharding For Heterogeneous Distributed Inference.

[BibT_eX]

[DOI]

CoRR, 2024

Complete Security and Privacy for AI Inference in Decentralized Systems.

[BibT_eX]

[DOI]

CoRR, 2024

AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks.

[BibT_eX]

[DOI]

CoRR, 2024

ConsistI2V: Enhancing Visual Consistency for Image-to-Video Generation.

[BibT_eX]

[DOI]

CoRR, 2024

2023

Latent-Shift: Latent Diffusion with Temporal Shift for Efficient Text-to-Video Generation.

[BibT_eX]

[DOI]

CoRR, 2023

Make-A-Video: Text-to-Video Generation without Text-Video Data.

[BibT_eX]

[DOI]

Proceedings of the Eleventh International Conference on Learning Representations, 2023

2022

RegMixup: Mixup as a Regularizer Can Surprisingly Improve Accuracy and Out Distribution Robustness.

[BibT_eX]

[DOI]

CoRR, 2022

Using Mixup as a Regularizer Can Surprisingly Improve Accuracy & Out-of-Distribution Robustness.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 35: Annual Conference on Neural Information Processing Systems 2022, 2022

MUGEN: A Playground for Video-Audio-Text Multimodal Understanding and GENeration.

[BibT_eX]

[DOI]

Proceedings of the Computer Vision - ECCV 2022, 2022

Long Video Generation with Time-Agnostic VQGAN and Time-Sensitive Transformer.

[BibT_eX]

[DOI]

Proceedings of the Computer Vision - ECCV 2022, 2022

2021

Robustness and Generalization via Generative Adversarial Training.

[BibT_eX]

[DOI]

Proceedings of the 2021 IEEE/CVF International Conference on Computer Vision, 2021

2019

Fine-grained Synthesis of Unrestricted Adversarial Examples.

[BibT_eX]

[DOI]

CoRR, 2019

2014

Low-rank SIFT: An affine invariant feature for place recognition.

[BibT_eX]

[DOI]

Proceedings of the 2014 IEEE International Conference on Image Processing, 2014

Harry Yang

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...