Jian Sha

Orcid: 0009-0006-9004-5959

According to our database¹, Jian Sha authored at least 10 papers between 2023 and 2025.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of three.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Links

On csauthors.net:

Bibliography

2025

Every FLOP Counts: Scaling a 300B Mixture-of-Experts LING LLM without Premium GPUs.

[BibT_eX]

[DOI]

CoRR, March, 2025

mLoRA: Fine-Tuning LoRA Adapters via Highly-Efficient Pipeline Parallelism in Multiple GPUs.

[BibT_eX]

[DOI]

Proc. VLDB Endow., February, 2025

XPUTimer: Anomaly Diagnostics for Divergent LLM Training in GPU Clusters of Thousand-Plus Scale.

[BibT_eX]

[DOI]

CoRR, February, 2025

EDiT: A Local-SGD-Based Efficient Distributed Training Method for Large Language Models.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

MEPipe: Democratizing LLM Training with Memory-Efficient Slice-Level Pipeline Scheduling on Cost-Effective Accelerators.

[BibT_eX]

[DOI]

Proceedings of the Twentieth European Conference on Computer Systems, 2025

2024

DLRover-RM: Resource Optimization for Deep Recommendation Models Training in the cloud.

[BibT_eX]

[DOI]

Proc. VLDB Endow., August, 2024

Enhancing hydrological extremes prediction accuracy: Integrating diverse loss functions in Transformer models.

[BibT_eX]

[DOI]

Environ. Model. Softw., 2024

Couler: Unified Machine Learning Workflow Optimization in Cloud.

[BibT_eX]

[DOI]

CoRR, 2024

Couler: Unified Machine Learning Workflow Optimization in Cloud.

[BibT_eX]

[DOI]

Proceedings of the 40th IEEE International Conference on Data Engineering, 2024

2023

ASPEN: High-Throughput LoRA Fine-Tuning of Large Language Models with a Single GPU.

[BibT_eX]

[DOI]

CoRR, 2023

Jian Sha

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...