Technische Fähigkeit

On-Device
Machine Learning

Sprach-Anti-Spoofing-Modelle, trainiert, auf INT8 quantisiert und auf extrem stromsparende neuronale Prozessoren bereitgestellt. Audio-Inferenz am Mikrofon, niemals in der Cloud.

LCNNINT8 QuantisierungONNX → TFLite → NPUASVspoof 2019

Trainingspipeline

PyTorch-basierte Trainingspipeline auf ASVspoof 2019 Logical Access. EER <2% bei der Validierung. Reproduzierbare Läufe mit fixierten Hyperparametern, Dataset-Versionierung und Seed-Kontrolle.

  • PyTorch + ASVspoof 2019 LA
  • Reproduzierbares Training unter Seed-Kontrolle
  • EER-Metrik über Epochen verfolgt

Quantisierung für extrem niedrigen Stromverbrauch

Post-Training-Quantisierung auf INT8 mit Kalibrierungssatz. Modellgröße um das 4-fache reduziert, Inferenzlatenz ähnlich reduziert, während die EER-Verschlechterung unter 0,5% gehalten wird.

  • PTQ mit repräsentativem Kalibrierungssatz
  • EER-Verschlechterung <0,5% nach der Quantisierung
  • Speicherbedarf geeignet für eingebettete NPU

NPU-Bereitstellung

ONNX-Export → TFLite-Zwischenformat → NPU-Herstellerformatkonvertierung. Validiert auf EU-Silizium-Anbieter Embedded NPU und anderen stromsparenden Beschleunigern. Inferenzlatenz <30 ms pro Audio-Frame.

  • ONNX als Austauschformat
  • TFLite als Zwischenformat
  • Herstellerspezifische NPU-Laufzeitintegration