On-Device
Machine Learning
Sprach-Anti-Spoofing-Modelle, trainiert, auf INT8 quantisiert und auf extrem stromsparende neuronale Prozessoren bereitgestellt. Audio-Inferenz am Mikrofon, niemals in der Cloud.
Trainingspipeline
PyTorch-basierte Trainingspipeline auf ASVspoof 2019 Logical Access. EER <2% bei der Validierung. Reproduzierbare Läufe mit fixierten Hyperparametern, Dataset-Versionierung und Seed-Kontrolle.
- PyTorch + ASVspoof 2019 LA
- Reproduzierbares Training unter Seed-Kontrolle
- EER-Metrik über Epochen verfolgt
Quantisierung für extrem niedrigen Stromverbrauch
Post-Training-Quantisierung auf INT8 mit Kalibrierungssatz. Modellgröße um das 4-fache reduziert, Inferenzlatenz ähnlich reduziert, während die EER-Verschlechterung unter 0,5% gehalten wird.
- PTQ mit repräsentativem Kalibrierungssatz
- EER-Verschlechterung <0,5% nach der Quantisierung
- Speicherbedarf geeignet für eingebettete NPU
NPU-Bereitstellung
ONNX-Export → TFLite-Zwischenformat → NPU-Herstellerformatkonvertierung. Validiert auf EU-Silizium-Anbieter Embedded NPU und anderen stromsparenden Beschleunigern. Inferenzlatenz <30 ms pro Audio-Frame.
- ONNX als Austauschformat
- TFLite als Zwischenformat
- Herstellerspezifische NPU-Laufzeitintegration