Engineering Capability

On-Device
Machine Learning

Modelli di anti-spoofing vocale addestrati, quantizzati a INT8 e deployati su processori neurali a bassissimo consumo. Inferenza audio sul microfono, mai nel cloud.

LCNNINT8 QuantizationONNX → TFLite → NPUASVspoof 2019

Training pipeline

Pipeline di training basata su PyTorch su ASVspoof 2019 Logical Access. EER <2% in validazione. Run riproducibili con iperparametri fissati, versionamento dei dataset e controllo dei seed.

  • PyTorch + ASVspoof 2019 LA
  • Reproducible training under seed control
  • EER metric tracked across epochs

Quantizzazione per ultra-low-power

Quantizzazione post-training a INT8 con calibration set. Dimensione del modello ridotta di 4×, latenza di inferenza ridotta in misura analoga, mentre la degradazione dell'EER è mantenuta sotto lo 0,5%.

  • PTQ con calibration set rappresentativo
  • EER degradation <0.5% post-quantization
  • Footprint di memoria adatto a NPU embedded

NPU deployment

ONNX export → TFLite intermediate → NPU vendor format conversion. Validated on fornitore EU NPU embedded and other low-power accelerators. Inference latency <30 ms per audio frame.

  • ONNX as exchange format
  • TFLite as intermediate
  • Vendor-specific NPU runtime integration