TorchSparse++: Efficient Training and Inference Framework for Sparse Convolution on GPUs

Sparse convolution plays a pivotal role in emerging workloads, including point cloud processing in AR/VR, autonomous driving, and graph understanding in recommendation systems. Since the computation pattern is sparse and irregular, specialized high-performance kernels are required. Existing GPU libr...

Full description

Bibliographic Details
Main Authors:	Tang, Haotian, Yang, Shang, Liu, Zhijian, Hong, Ke, Yu, Zhongming, Li, Xiuyu, Dai, Guohao, Wang, Yu, Han, Song
Format:	Article
Language:	English
Published:	ACM\|56th Annual IEEE/ACM International Symposium on Microarchitecture 2024
Online Access:	https://hdl.handle.net/1721.1/153260

Internet

https://hdl.handle.net/1721.1/153260

TorchSparse++: Efficient Training and Inference Framework for Sparse Convolution on GPUs

Internet

Similar Items