Aprendizaje automático
en el dispositivo
Modelos de anti-spoofing de voz entrenados, cuantificados a INT8 y desplegados en procesadores neuronales de ultra bajo consumo. Inferencia de audio en el micrófono, nunca en la nube.
Pipeline de entrenamiento
Pipeline de entrenamiento basado en PyTorch sobre ASVspoof 2019 Logical Access. EER <2% en validación. Ejecuciones reproducibles con hiperparámetros fijados, versionado de conjuntos de datos y control de semillas.
- PyTorch + ASVspoof 2019 LA
- Entrenamiento reproducible bajo control de semillas
- Métrica EER rastreada a través de épocas
Cuantificación para ultra bajo consumo
Cuantificación post-entrenamiento a INT8 con conjunto de calibración. El tamaño del modelo se reduce en 4×, la latencia de inferencia se reduce de manera similar, mientras que la degradación de EER se mantiene por debajo del 0.5%.
- PTQ con conjunto de calibración representativo
- Degradación de EER <0.5% post-cuantificación
- Huella de memoria adecuada para NPU embebida
Despliegue en NPU
Exportación ONNX → Intermedio TFLite → Conversión de formato de proveedor NPU. Validado en proveedor UE NPU embebida y otros aceleradores de bajo consumo. Latencia de inferencia <30 ms por fotograma de audio.
- ONNX como formato de intercambio
- TFLite como intermedio
- Integración de tiempo de ejecución NPU específica del proveedor