Publications

Ziji Shi, Le Jiang, Jie Zhang, Xianyan Jia, Yong Li, Chencan Wu, Jialin Li, Wei Lin (2023). TAP: Efficient Derivation of Tensor Parallel Plans for Large Neural Networks. In ISCA'23 ASSYST Workshop.

PDF Cite Poster

Ziji Shi, Fuzhao Xue, Jialin Li, Yang You (2023). ParaGAN: A Cloud Training Framework for Generative Adversarial Networks. In ISCA'23 MLArchSys Workshop.

PDF Cite Poster

Xianyan Jia, Le Jiang, Ang Wang, Wencong Xiao, Ziji Shi, Jie Zhang, Xinyuan Li, Langshi Chen, Yong Li, Zhen Zheng, Xiaoyong Liu, Wei Lin (2022). Whale: Efficient Giant Model Training over Heterogeneous GPUs. In USENIX ATC'22.

PDF Cite Code Slides

Fuzhao Xue, Ziji Shi, Futao Wei, Yuxuan Lou, Yong Liu, Yang You (2021). Going Wider Instead of Deeper. In AAAI'22.