Differentiable Neural Architecture, Mixed Precision and Accelerator Co-Search

Quantization, effective Neural Network architecture, and efficient accelerator hardware are three important design paradigms to maximize accuracy and efficiency. Mixed Precision Quantization is a process of assigning different precision to different Neural Network layers for optimized inference. Neu...

Full description

Bibliographic Details
Main Authors:	Krishna Teja Chitty-Venkata, Yiming Bian, Murali Emani, Venkatram Vishwanath, Arun K. Somani
Format:	Article
Language:	English
Published:	IEEE 2023-01-01
Series:	IEEE Access
Subjects:	Mixed precision quantization hardware-aware neural architecture search accelerator network co-search
Online Access:	https://ieeexplore.ieee.org/document/10266308/

Internet

https://ieeexplore.ieee.org/document/10266308/

Differentiable Neural Architecture, Mixed Precision and Accelerator Co-Search

Internet

Similar Items