Technische Fähigkeit

On-Device
Machine Learning

Sprach-Anti-Spoofing-Modelle, trainiert, auf INT8 quantisiert und auf extrem stromsparende neuronale Prozessoren bereitgestellt. Audio-Inferenz am Mikrofon, niemals in der Cloud.

LCNNINT8 QuantisierungONNX → TFLite → NPUASVspoof 2019

Trainingspipeline

PyTorch-basierte Trainingspipeline auf ASVspoof 2019 Logical Access. EER <2% bei der Validierung. Reproduzierbare Läufe mit fixierten Hyperparametern, Dataset-Versionierung und Seed-Kontrolle.

PyTorch + ASVspoof 2019 LA
Reproduzierbares Training unter Seed-Kontrolle
EER-Metrik über Epochen verfolgt

Quantisierung für extrem niedrigen Stromverbrauch

Post-Training-Quantisierung auf INT8 mit Kalibrierungssatz. Modellgröße um das 4-fache reduziert, Inferenzlatenz ähnlich reduziert, während die EER-Verschlechterung unter 0,5% gehalten wird.

PTQ mit repräsentativem Kalibrierungssatz
EER-Verschlechterung <0,5% nach der Quantisierung
Speicherbedarf geeignet für eingebettete NPU

NPU-Bereitstellung

ONNX-Export → TFLite-Zwischenformat → NPU-Herstellerformatkonvertierung. Validiert auf EU-Silizium-Anbieter Embedded NPU und anderen stromsparenden Beschleunigern. Inferenzlatenz <30 ms pro Audio-Frame.

ONNX als Austauschformat
TFLite als Zwischenformat
Herstellerspezifische NPU-Laufzeitintegration

On-Device ML besprechen

On-Device ML besprechen Dokumentation der Trainingspipeline

On-DeviceMachine Learning

Trainingspipeline

Quantisierung für extrem niedrigen Stromverbrauch

NPU-Bereitstellung

On-Device ML besprechen

On-Device
Machine Learning