Capacidad de Ingeniería

Aprendizaje automático
en el dispositivo

Modelos de anti-spoofing de voz entrenados, cuantificados a INT8 y desplegados en procesadores neuronales de ultra bajo consumo. Inferencia de audio en el micrófono, nunca en la nube.

LCNNCuantificación INT8ONNX → TFLite → NPUASVspoof 2019

Pipeline de entrenamiento

Pipeline de entrenamiento basado en PyTorch sobre ASVspoof 2019 Logical Access. EER <2% en validación. Ejecuciones reproducibles con hiperparámetros fijados, versionado de conjuntos de datos y control de semillas.

PyTorch + ASVspoof 2019 LA
Entrenamiento reproducible bajo control de semillas
Métrica EER rastreada a través de épocas

Cuantificación para ultra bajo consumo

Cuantificación post-entrenamiento a INT8 con conjunto de calibración. El tamaño del modelo se reduce en 4×, la latencia de inferencia se reduce de manera similar, mientras que la degradación de EER se mantiene por debajo del 0.5%.

PTQ con conjunto de calibración representativo
Degradación de EER <0.5% post-cuantificación
Huella de memoria adecuada para NPU embebida

Despliegue en NPU

Exportación ONNX → Intermedio TFLite → Conversión de formato de proveedor NPU. Validado en proveedor UE NPU embebida y otros aceleradores de bajo consumo. Latencia de inferencia <30 ms por fotograma de audio.

ONNX como formato de intercambio
TFLite como intermedio
Integración de tiempo de ejecución NPU específica del proveedor

Discutir ML en el dispositivo

Discutir ML en el dispositivo Documentos del pipeline de entrenamiento

Aprendizaje automáticoen el dispositivo

Pipeline de entrenamiento

Cuantificación para ultra bajo consumo

Despliegue en NPU

Discutir ML en el dispositivo

Aprendizaje automático
en el dispositivo