Engineering Capability

On-Device
Machine Learning

Modelli di anti-spoofing vocale addestrati, quantizzati a INT8 e deployati su processori neurali a bassissimo consumo. Inferenza audio sul microfono, mai nel cloud.

LCNNINT8 QuantizationONNX → TFLite → NPUASVspoof 2019

Training pipeline

Pipeline di training basata su PyTorch su ASVspoof 2019 Logical Access. EER <2% in validazione. Run riproducibili con iperparametri fissati, versionamento dei dataset e controllo dei seed.

PyTorch + ASVspoof 2019 LA
Training riproducibile con controllo dei seed
Metrica EER tracciata epoca per epoca

Quantizzazione per ultra-low-power

Quantizzazione post-training a INT8 con calibration set. Dimensione del modello ridotta di 4×, latenza di inferenza ridotta in misura analoga, mentre la degradazione dell'EER è mantenuta sotto lo 0,5%.

PTQ con calibration set rappresentativo
EER degradation <0.5% post-quantization
Footprint di memoria adatto a NPU embedded

NPU deployment

ONNX export → TFLite intermediate → NPU vendor format conversion. Validated on fornitore EU NPU embedded and other low-power accelerators. Inference latency <30 ms per audio frame.

ONNX as exchange format
TFLite as intermediate
Integrazione con runtime NPU specifici del vendor

Parli con noi di ML on-device

Parli con noi di ML on-device Training pipeline docs

On-DeviceMachine Learning

Training pipeline

Quantizzazione per ultra-low-power

NPU deployment

Parli con noi di ML on-device

On-Device
Machine Learning