Fangcheng Fu

Orcid: 0000-0003-1658-0380

According to our database¹, Fangcheng Fu authored at least 62 papers between 2018 and 2025.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Bibliography

2025

TridentServe: A Stage-level Serving System for Diffusion Pipelines.

[BibT_eX]

[DOI]

CoRR, October, 2025

Data-Centric Elastic Pipeline Parallelism for Efficient Long-Context LLM Training.

[BibT_eX]

[DOI]

CoRR, September, 2025

Efficient Mixed-Precision Large Language Model Inference with TurboMind.

[BibT_eX]

[DOI]

CoRR, August, 2025

PS-MI: Accurate, Efficient, and Private Data Valuation in Vertical Federated Learning.

[BibT_eX]

[DOI]

Proc. VLDB Endow., June, 2025

PQCache: Product Quantization-based KVCache for Long Context LLM Inference.

[BibT_eX]

[DOI]

Proc. ACM Manag. Data, June, 2025

Malleus: Straggler-Resilient Hybrid Parallel Training of Large-scale Models via Malleable Data and Model Parallelization.

[BibT_eX]

[DOI]

Proc. ACM Manag. Data, June, 2025

How Significant Are the Real Performance Gains? An Unbiased Evaluation Framework for GraphRAG.

[BibT_eX]

[DOI]

CoRR, June, 2025

Cascadia: A Cascade Serving System for Large Language Models.

[BibT_eX]

[DOI]

CoRR, June, 2025

SALE : Low-bit Estimation for Efficient Sparse Attention in Long-context LLM Prefilling.

[BibT_eX]

[DOI]

CoRR, May, 2025

Thinking Short and Right Over Thinking Long: Serving LLM Reasoning Efficiently and Accurately.

[BibT_eX]

[DOI]

CoRR, May, 2025

LobRA: Multi-tenant Fine-tuning over Heterogeneous Data.

[BibT_eX]

[DOI]

Proc. VLDB Endow., April, 2025

Galvatron: An Automatic Distributed System for Efficient Foundation Model Training.

[BibT_eX]

[DOI]

CoRR, April, 2025

Hetu v2: A General and Scalable Deep Learning System with Hierarchical and Heterogeneous Single Program Multiple Data Annotations.

[BibT_eX]

[DOI]

CoRR, April, 2025

Detecting and Analyzing Motifs in Large-Scale Online Transaction Networks.

[BibT_eX]

[DOI]

IEEE Trans. Knowl. Data Eng., February, 2025

MEMO: Fine-grained Tensor Management For Ultra-long Context LLM Training.

[BibT_eX]

[DOI]

Proc. ACM Manag. Data, February, 2025

ByteScale: Efficient Scaling of LLM Training with a 2048K Context Length on More Than 12,000 GPUs.

[BibT_eX]

[DOI]

CoRR, February, 2025

Training-free and Adaptive Sparse Attention for Efficient Long Video Generation.

[BibT_eX]

[DOI]

CoRR, February, 2025

ThunderServe: High-performance and Cost-efficient LLM Serving in Cloud Environments.

[BibT_eX]

[DOI]

CoRR, February, 2025

Demystifying Cost-Efficiency in LLM Serving over Heterogeneous GPUs.

[BibT_eX]

[DOI]

CoRR, February, 2025

ByteScale: Communication-Efficient Scaling of LLM Training with a 2048K Context Length on 16384 GPUs.

[BibT_eX]

[DOI]

Proceedings of the ACM SIGCOMM 2025 Conference, 2025

Model Rake: A Defense Against Stealing Attacks in Split Learning.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Fourth International Joint Conference on Artificial Intelligence, 2025

NetMoE: Accelerating MoE Training through Dynamic Sample Placement.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

Hounding Data Diversity: Towards Participant Selection in Vertical Federated Learning.

[BibT_eX]

[DOI]

Proceedings of the 41st IEEE International Conference on Data Engineering, 2025

Towards Scalable and Efficient Graph Structure Learning.

[BibT_eX]

[DOI]

Proceedings of the 41st IEEE International Conference on Data Engineering, 2025

Spindle: Efficient Distributed Training of Multi-Task Large Models via Wavefront Scheduling.

[BibT_eX]

[DOI]

Proceedings of the 30th ACM International Conference on Architectural Support for Programming Languages and Operating Systems, 2025

FlexSP: Accelerating Large Language Model Training via Flexible Sequence Parallelism.

[BibT_eX]

[DOI]

Proceedings of the 30th ACM International Conference on Architectural Support for Programming Languages and Operating Systems, 2025

Enhancing Unsupervised Sentence Embeddings via Knowledge-Driven Data Augmentation and Gaussian-Decayed Contrastive Learning.

[BibT_eX]

[DOI]

Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025

HaCore: Efficient Coreset Construction with Locality Sensitive Hashing for Vertical Federated Learning.

[BibT_eX]

[DOI]

Proceedings of the AAAI-25, Sponsored by the Association for the Advancement of Artificial Intelligence, February 25, 2025

2024

ProjPert: Projection-Based Perturbation for Label Protection in Split Learning Based Vertical Federated Learning.

[BibT_eX]

[DOI]

IEEE Trans. Knowl. Data Eng., July, 2024

Improving Automatic Parallel Training via Balanced Memory Workload Optimization.

[BibT_eX]

[DOI]

IEEE Trans. Knowl. Data Eng., 2024

Demystifying Workload Imbalances in Large Transformer Model Training over Variable-length Sequences.

[BibT_eX]

[DOI]

CoRR, 2024

Data-Centric and Heterogeneity-Adaptive Sequence Parallelism for Efficient LLM Training.

[BibT_eX]

[DOI]

CoRR, 2024

Gradual Learning: Optimizing Fine-Tuning with Partially Mastered Knowledge in Large Language Models.

[BibT_eX]

[DOI]

CoRR, 2024

Retrofitting Temporal Graph Neural Networks with Transformer.

[BibT_eX]

[DOI]

CoRR, 2024

Efficient Multi-Task Large Model Training via Data Heterogeneity-aware Model Management.

[BibT_eX]

[DOI]

CoRR, 2024

Efficiently Training 7B LLM with 1 Million Sequence Length on 8 GPUs.

[BibT_eX]

[DOI]

CoRR, 2024

Retrieval-Augmented Generation for AI-Generated Content: A Survey.

[BibT_eX]

[DOI]

CoRR, 2024

Enabling Parallelism Hot Switching for Efficient Training of Large Language Models.

[BibT_eX]

[DOI]

Proceedings of the ACM SIGOPS 30th Symposium on Operating Systems Principles, 2024

Efficient Multi-task LLM Quantization and Serving for Multiple LoRA Adapters.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 38: Annual Conference on Neural Information Processing Systems 2024, 2024

LSH-MoE: Communication-efficient MoE Training via Locality-Sensitive Hashing.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 38: Annual Conference on Neural Information Processing Systems 2024, 2024

X-former Elucidator: Reviving Efficient Attention for Long Context Language Modeling.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence, 2024

Generative and Contrastive Paradigms Are Complementary for Graph Self-Supervised Learning.

[BibT_eX]

[DOI]

Proceedings of the 40th IEEE International Conference on Data Engineering, 2024

Accelerating Text-to-Image Editing via Cache-Enabled Sparse Diffusion Inference.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Eighth AAAI Conference on Artificial Intelligence, 2024

2023

P<sup>2</sup>CG: a privacy preserving collaborative graph neural network training framework.

[BibT_eX]

[DOI]

VLDB J., July, 2023

Angel-PTM: A Scalable and Economical Large-scale Pre-training System in Tencent.

[BibT_eX]

[DOI]

Proc. VLDB Endow., 2023

Generative and Contrastive Paradigms Are Complementary for Graph Self-Supervised Learning.

[BibT_eX]

[DOI]

CoRR, 2023

Improving Automatic Parallel Training via Balanced Memory Workload Optimization.

[BibT_eX]

[DOI]

CoRR, 2023

FISEdit: Accelerating Text-to-image Editing via Cache-enabled Sparse Diffusion Inference.

[BibT_eX]

[DOI]

CoRR, 2023

OSDP: Optimal Sharded Data Parallel for Distributed Deep Learning.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Second International Joint Conference on Artificial Intelligence, 2023

KVSAgg: Secure Aggregation of Distributed Key-Value Sets.

[BibT_eX]

[DOI]

Proceedings of the 39th IEEE International Conference on Data Engineering, 2023

2022

Towards Communication-efficient Vertical Federated Learning Training via Cache-enabled Local Update.

[BibT_eX]

[DOI]

Proc. VLDB Endow., 2022

Towards Communication-efficient Vertical Federated Learning Training via Cache-enabled Local Updates.

[BibT_eX]

[DOI]

CoRR, 2022

BlindFL: Vertical Federated Machine Learning without Peeking into Your Data.

[BibT_eX]

[DOI]

Proceedings of the SIGMOD '22: International Conference on Management of Data, Philadelphia, PA, USA, June 12, 2022

K-core decomposition on super large graphs with limited resources.

[BibT_eX]

[DOI]

Proceedings of the SAC '22: The 37th ACM/SIGAPP Symposium on Applied Computing, Virtual Event, April 25, 2022

VF-PS: How to Select Important Participants in Vertical Federated Learning, Efficiently and Securely?

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 35: Annual Conference on Neural Information Processing Systems 2022, 2022

Analyzing Online Transaction Networks with Network Motifs.

[BibT_eX]

[DOI]

Proceedings of the KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14, 2022

2021

VF<sup>2</sup>Boost: Very Fast Vertical Federated Gradient Boosting for Cross-Enterprise Learning.

[BibT_eX]

[DOI]

Proceedings of the SIGMOD '21: International Conference on Management of Data, 2021

2020

SKCompress: compressing sparse and nonuniform gradient in distributed machine learning.

[BibT_eX]

[DOI]

VLDB J., 2020

Don't Waste Your Bits! Squeeze Activations and Gradients for Deep Neural Networks via TinyScript.

[BibT_eX]

[DOI]

Proceedings of the 37th International Conference on Machine Learning, 2020

2019

An Experimental Evaluation of Large Scale GBDT Systems.

[BibT_eX]

[DOI]

Proc. VLDB Endow., 2019

2018

SketchML: Accelerating Distributed Machine Learning with Data Sketches.

[BibT_eX]

[DOI]

Proceedings of the 2018 International Conference on Management of Data, 2018

DimBoost: Boosting Gradient Boosting Decision Tree to Higher Dimensions.

[BibT_eX]

[DOI]

Proceedings of the 2018 International Conference on Management of Data, 2018

Fangcheng Fu

Timeline

Legend:

Links

Online presence:

On csauthors.net:

Bibliography

Loading...