Hao Liang

Orcid: 0009-0000-2963-2210

Affiliations:

Peking University, Center for Data Science, Beijing, China

According to our database¹, Hao Liang authored at least 67 papers between 2024 and 2026.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Bibliography

2026

LatentOmni: Rethinking Omni-Modal Understanding via Unified Audio-Visual Latent Reasoning.

[BibT_eX]

[DOI]

CoRR, May, 2026

Uni-Synergy: Bridging Understanding and Generation for Personalized Reasoning via Co-operative Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, May, 2026

FLARE: Full-Modality Long-Video Audiovisual Retrieval Benchmark with User-Simulated Queries.

[BibT_eX]

[DOI]

CoRR, May, 2026

K12-KGraph: A Curriculum-Aligned Knowledge Graph for Benchmarking and Training Educational LLMs.

[BibT_eX]

[DOI]

CoRR, May, 2026

TraceAV-Bench: Benchmarking Multi-Hop Trajectory Reasoning over Long Audio-Visual Videos.

[BibT_eX]

[DOI]

CoRR, May, 2026

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models.

[BibT_eX]

[DOI]

CoRR, April, 2026

DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models.

[BibT_eX]

[DOI]

CoRR, March, 2026

Towards Next-Generation LLM Training: From the Data-Centric Perspective.

[BibT_eX]

[DOI]

CoRR, March, 2026

One-Eval: An Agentic System for Automated and Traceable LLM Evaluation.

[BibT_eX]

[DOI]

CoRR, March, 2026

BrowseComp-V<sup>3</sup>: A Visual, Vertical, and Verifiable Benchmark for Multimodal Browsing Agents.

[BibT_eX]

[DOI]

CoRR, February, 2026

Canvas-of-Thought: Grounding Reasoning via Mutable Structured States.

[BibT_eX]

[DOI]

CoRR, February, 2026

M2A: Multimodal Memory Agent with Dual-Layer Hybrid Memory for Long-Term Personalized Interactions.

[BibT_eX]

[DOI]

CoRR, February, 2026

Research on World Models Is Not Merely Injecting World Knowledge into Specific Tasks.

[BibT_eX]

[DOI]

CoRR, February, 2026

Data Preparation for Large Language Models.

[BibT_eX]

[DOI]

J. Comput. Sci. Technol., January, 2026

MathMixup: Boosting LLM Mathematical Reasoning with Difficulty-Controllable Data Synthesis and Curriculum Learning.

[BibT_eX]

[DOI]

CoRR, January, 2026

LoVR: A Benchmark for Long Video Retrieval in Multimodal Contexts.

[BibT_eX]

[DOI]

Proceedings of the ACM Web Conference 2026, 2026

Let's Verify Math Questions Step by Step.

[BibT_eX]

[DOI]

Proceedings of the 32nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining V.1, 2026

2025

DataFlow: An LLM-Driven Framework for Unified Data Preparation and Workflow Automation in the Era of Data-Centric AI.

[BibT_eX]

[DOI]

CoRR, December, 2025

Scone: Bridging Composition and Distinction in Subject-Driven Image Generation via Unified Understanding-Generation Modeling.

[BibT_eX]

[DOI]

CoRR, December, 2025

BRACE: A Benchmark for Robust Audio Caption Quality Evaluation.

[BibT_eX]

[DOI]

CoRR, December, 2025

VABench: A Comprehensive Benchmark for Audio-Video Generation.

[BibT_eX]

[DOI]

CoRR, December, 2025

DataGovBench: Benchmarking LLM Agents for Real-World Data Governance Workflows.

[BibT_eX]

[DOI]

CoRR, December, 2025

VCU-Bridge: Hierarchical Visual Connotation Understanding via Semantic Bridging.

[BibT_eX]

[DOI]

CoRR, November, 2025

FlipVQA-Miner: Cross-Page Visual Question-Answer Mining from Textbooks.

[BibT_eX]

[DOI]

CoRR, November, 2025

Text2SQL-Flow: A Robust SQL-Aware Data Augmentation Framework for Text-to-SQL.

[BibT_eX]

[DOI]

CoRR, November, 2025

Rethinking Text-to-SQL: Dynamic Multi-turn SQL Interaction for Real-world Database Exploration.

[BibT_eX]

[DOI]

CoRR, October, 2025

Jarvis: Towards Personalized AI Assistant via Personal KV-Cache Retrieval.

[BibT_eX]

[DOI]

CoRR, October, 2025

LongInsightBench: A Comprehensive Benchmark for Evaluating Omni-Modal Models on Human-Centric Long-Video Understanding.

[BibT_eX]

[DOI]

CoRR, October, 2025

MorphoBench: A Benchmark with Difficulty Adaptive to Model Reasoning.

[BibT_eX]

[DOI]

CoRR, October, 2025

CapGeo: A Caption-Assisted Approach to Geometric Reasoning.

[BibT_eX]

[DOI]

CoRR, October, 2025

DARO: Difficulty-Aware Reweighting Policy Optimization.

[BibT_eX]

[DOI]

CoRR, October, 2025

Multimodal Reasoning for Science: Technical Report and 1st Place Solution to the ICML 2025 SeePhys Challenge.

[BibT_eX]

[DOI]

CoRR, September, 2025

Native Visual Understanding: Resolving Resolution Dilemmas in Vision-Language Models.

[BibT_eX]

[DOI]

CoRR, June, 2025

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions.

[BibT_eX]

[DOI]

CoRR, June, 2025

LogicPuzzleRL: Cultivating Robust Mathematical Reasoning in LLMs via Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, June, 2025

LoVR: A Benchmark for Long Video Retrieval in Multimodal Contexts.

[BibT_eX]

[DOI]

CoRR, May, 2025

Unlocking the Potential of Difficulty Prior in RL-based Multimodal Reasoning.

[BibT_eX]

[DOI]

CoRR, May, 2025

Concept-as-Tree: Synthetic Data is All You Need for VLM Personalization.

[BibT_eX]

[DOI]

CoRR, March, 2025

Evaluating and Predicting Distorted Human Body Parts for Generated Images.

[BibT_eX]

[DOI]

CoRR, March, 2025

MathClean: A Benchmark for Synthetic Mathematical Data Cleaning.

[BibT_eX]

[DOI]

CoRR, February, 2025

MM-Verify: Enhancing Multimodal Reasoning with Chain-of-Thought Verification.

[BibT_eX]

[DOI]

CoRR, February, 2025

UniCTokens: Boosting Personalized Understanding and Generation via Unified Concept Tokens.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 38: Annual Conference on Neural Information Processing Systems 2025, 2025

SynthVLM: Towards High-Quality and Efficient Synthesis of Image-Caption Datasets for Vision-Language Models.

[BibT_eX]

[DOI]

Proceedings of the 33rd ACM International Conference on Multimedia, 2025

MathScape: Benchmarking Multimodal Large Language Models in Real-World Mathematical Contexts.

[BibT_eX]

[DOI]

Hao Liang

Linzhuang Sun

zhouminxuan zhouminxuan

Proceedings of the 33rd ACM International Conference on Multimedia, 2025

Facilitating Multi-turn Function Calling for LLMs via Compositional Instruction Tuning.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

PAS: Plug-and-Play Prompt Augmentation System.

[BibT_eX]

[DOI]

Proceedings of the 41st IEEE International Conference on Data Engineering, 2025

Training Data Distribution Estimation for Optimized Pre-training Data Management.

[BibT_eX]

[DOI]

Proceedings of the 41st IEEE International Conference on Data Engineering, 2025

CFBench: A Comprehensive Constraints-Following Benchmark for LLMs.

[BibT_eX]

[DOI]

Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025

QAEncoder: Towards Aligned Representation Learning in Question Answering Systems.

[BibT_eX]

[DOI]

Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025

MM-Verify: Enhancing Multimodal Reasoning with Chain-of-Thought Verification.

[BibT_eX]

[DOI]

Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025

2024

MC-LLaVA: Multi-Concept Personalized Vision-Language Model.

[BibT_eX]

[DOI]

CoRR, 2024

EVQAScore: Efficient Video Question Answering Data Evaluation.

[BibT_eX]

[DOI]

Hao Liang

Zirong Chen

Wentao Zhang

CoRR, 2024

Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction.

[BibT_eX]

[DOI]

Qintong Zhang

Victor Shea-Jay Huang

CoRR, 2024

Baichuan Alignment Technical Report.

[BibT_eX]

[DOI]

CoRR, 2024

Gradual Learning: Optimizing Fine-Tuning with Partially Mastered Knowledge in Large Language Models.

[BibT_eX]

[DOI]

CoRR, 2024

QAEncoder: Towards Aligned Representation Learning in Question Answering System.

[BibT_eX]

[DOI]

CoRR, 2024

BEATS: Optimizing LLM Mathematical Capabilities with BackVerify and Adaptive Disambiguate based Efficient Tree Search.

[BibT_eX]

[DOI]

CoRR, 2024

Data Proportion Detection for Optimized Data Management for Large Language Models.

[BibT_eX]

[DOI]

CoRR, 2024

MathScape: Evaluating MLLMs in multimodal Math Scenarios through a Hierarchical Benchmark.

[BibT_eX]

[DOI]

CoRR, 2024

CFBench: A Comprehensive Constraints-Following Benchmark for LLMs.

[BibT_eX]

[DOI]

CoRR, 2024

Are Bigger Encoders Always Better in Vision Large Models?

[BibT_eX]

[DOI]

CoRR, 2024

Synth-Empathy: Towards High-Quality Synthetic Empathy Data.

[BibT_eX]

[DOI]

CoRR, 2024

SynthVLM: High-Efficiency and High-Quality Synthetic Data for Vision Language Models.

[BibT_eX]

[DOI]

CoRR, 2024

PAS: Data-Efficient Plug-and-Play Prompt Augmentation System.

[BibT_eX]

[DOI]

CoRR, 2024

KeyVideoLLM: Towards Large-scale Video Keyframe Selection.

[BibT_eX]

[DOI]

CoRR, 2024

Efficient-Empathy: Towards Efficient and Effective Selection of Empathy Data.

[BibT_eX]

[DOI]

CoRR, 2024

A Survey of Multimodal Large Language Model from A Data-centric Perspective.

[BibT_eX]

[DOI]

CoRR, 2024

Hao Liang

Timeline

Legend:

Links

Online presence:

On csauthors.net:

Bibliography

Loading...