Hao Liang

Affiliations:

Peking University, Center for Data Science, Beijing, China

According to our database¹, Hao Liang authored at least 38 papers between 2024 and 2025.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Bibliography

2025

Rethinking Text-to-SQL: Dynamic Multi-turn SQL Interaction for Real-world Database Exploration.

[BibT_eX]

[DOI]

CoRR, October, 2025

Jarvis: Towards Personalized AI Assistant via Personal KV-Cache Retrieval.

[BibT_eX]

[DOI]

CoRR, October, 2025

CapGeo: A Caption-Assisted Approach to Geometric Reasoning.

[BibT_eX]

[DOI]

CoRR, October, 2025

DARO: Difficulty-Aware Reweighting Policy Optimization.

[BibT_eX]

[DOI]

CoRR, October, 2025

LongCat-Flash-Thinking Technical Report.

[BibT_eX]

[DOI]

CoRR, September, 2025

Multimodal Reasoning for Science: Technical Report and 1st Place Solution to the ICML 2025 SeePhys Challenge.

[BibT_eX]

[DOI]

CoRR, September, 2025

Native Visual Understanding: Resolving Resolution Dilemmas in Vision-Language Models.

[BibT_eX]

[DOI]

CoRR, June, 2025

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions.

[BibT_eX]

[DOI]

CoRR, June, 2025

LogicPuzzleRL: Cultivating Robust Mathematical Reasoning in LLMs via Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, June, 2025

UniCTokens: Boosting Personalized Understanding and Generation via Unified Concept Tokens.

[BibT_eX]

[DOI]

CoRR, May, 2025

LoVR: A Benchmark for Long Video Retrieval in Multimodal Contexts.

[BibT_eX]

[DOI]

CoRR, May, 2025

Let's Verify Math Questions Step by Step.

[BibT_eX]

[DOI]

CoRR, May, 2025

Unlocking the Potential of Difficulty Prior in RL-based Multimodal Reasoning.

[BibT_eX]

[DOI]

CoRR, May, 2025

Concept-as-Tree: Synthetic Data is All You Need for VLM Personalization.

[BibT_eX]

[DOI]

CoRR, March, 2025

Evaluating and Predicting Distorted Human Body Parts for Generated Images.

[BibT_eX]

[DOI]

CoRR, March, 2025

MathClean: A Benchmark for Synthetic Mathematical Data Cleaning.

[BibT_eX]

[DOI]

CoRR, February, 2025

MM-Verify: Enhancing Multimodal Reasoning with Chain-of-Thought Verification.

[BibT_eX]

[DOI]

CoRR, February, 2025

Baichuan-Omni-1.5 Technical Report.

[BibT_eX]

[DOI]

CoRR, January, 2025

Facilitating Multi-turn Function Calling for LLMs via Compositional Instruction Tuning.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

PAS: Plug-and-Play Prompt Augmentation System.

[BibT_eX]

[DOI]

Proceedings of the 41st IEEE International Conference on Data Engineering, 2025

Training Data Distribution Estimation for Optimized Pre-training Data Management.

[BibT_eX]

[DOI]

Proceedings of the 41st IEEE International Conference on Data Engineering, 2025

CFBench: A Comprehensive Constraints-Following Benchmark for LLMs.

[BibT_eX]

[DOI]

Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025

MM-Verify: Enhancing Multimodal Reasoning with Chain-of-Thought Verification.

[BibT_eX]

[DOI]

Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025

2024

MC-LLaVA: Multi-Concept Personalized Vision-Language Model.

[BibT_eX]

[DOI]

CoRR, 2024

EVQAScore: Efficient Video Question Answering Data Evaluation.

[BibT_eX]

[DOI]

Hao Liang

Zirong Chen

Wentao Zhang

CoRR, 2024

Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction.

[BibT_eX]

[DOI]

Qintong Zhang

Victor Shea-Jay Huang

CoRR, 2024

Baichuan Alignment Technical Report.

[BibT_eX]

[DOI]

CoRR, 2024

Gradual Learning: Optimizing Fine-Tuning with Partially Mastered Knowledge in Large Language Models.

[BibT_eX]

[DOI]

CoRR, 2024

BEATS: Optimizing LLM Mathematical Capabilities with BackVerify and Adaptive Disambiguate based Efficient Tree Search.

[BibT_eX]

[DOI]

CoRR, 2024

Data Proportion Detection for Optimized Data Management for Large Language Models.

[BibT_eX]

[DOI]

CoRR, 2024

MathScape: Evaluating MLLMs in multimodal Math Scenarios through a Hierarchical Benchmark.

[BibT_eX]

[DOI]

CoRR, 2024

CFBench: A Comprehensive Constraints-Following Benchmark for LLMs.

[BibT_eX]

[DOI]

CoRR, 2024

Synth-Empathy: Towards High-Quality Synthetic Empathy Data.

[BibT_eX]

[DOI]

CoRR, 2024

SynthVLM: High-Efficiency and High-Quality Synthetic Data for Vision Language Models.

[BibT_eX]

[DOI]

CoRR, 2024

PAS: Data-Efficient Plug-and-Play Prompt Augmentation System.

[BibT_eX]

[DOI]

CoRR, 2024

KeyVideoLLM: Towards Large-scale Video Keyframe Selection.

[BibT_eX]

[DOI]

CoRR, 2024

Efficient-Empathy: Towards Efficient and Effective Selection of Empathy Data.

[BibT_eX]

[DOI]

CoRR, 2024

A Survey of Multimodal Large Language Model from A Data-centric Perspective.

[BibT_eX]

[DOI]

CoRR, 2024

Hao Liang

Timeline

Legend:

Links

Online presence:

On csauthors.net:

Bibliography

Loading...