# A 95.6-TOPS/W Deep Learning Inference Accelerator With Per-Vector Scaled 4-bit Quantization in 5 nm

> Research article (IEEE Journal of Solid-State Circuits, 2023) · cited 49× · AI/ML

**Wikidata**: [openalex:W4319996342](https://www.wikidata.org/wiki/openalex:W4319996342)  
**Source**: https://4ort.xyz/entity/a-95-6-tops-w-deep-learning-inference-accelerator-with-per-vector-scaled-4-bit-quantization-in-5-nm