Engineering Capability
On-Device
Machine Learning
Modelli di anti-spoofing vocale addestrati, quantizzati a INT8 e deployati su processori neurali a bassissimo consumo. Inferenza audio sul microfono, mai nel cloud.
LCNNINT8 QuantizationONNX → TFLite → NPUASVspoof 2019
Training pipeline
Pipeline di training basata su PyTorch su ASVspoof 2019 Logical Access. EER <2% in validazione. Run riproducibili con iperparametri fissati, versionamento dei dataset e controllo dei seed.
- PyTorch + ASVspoof 2019 LA
- Reproducible training under seed control
- EER metric tracked across epochs
Quantizzazione per ultra-low-power
Quantizzazione post-training a INT8 con calibration set. Dimensione del modello ridotta di 4×, latenza di inferenza ridotta in misura analoga, mentre la degradazione dell'EER è mantenuta sotto lo 0,5%.
- PTQ con calibration set rappresentativo
- EER degradation <0.5% post-quantization
- Footprint di memoria adatto a NPU embedded
NPU deployment
ONNX export → TFLite intermediate → NPU vendor format conversion. Validated on fornitore EU NPU embedded and other low-power accelerators. Inference latency <30 ms per audio frame.
- ONNX as exchange format
- TFLite as intermediate
- Vendor-specific NPU runtime integration