Capacidad de Ingeniería

Aprendizaje automático
en el dispositivo

Modelos de anti-spoofing de voz entrenados, cuantificados a INT8 y desplegados en procesadores neuronales de ultra bajo consumo. Inferencia de audio en el micrófono, nunca en la nube.

LCNNCuantificación INT8ONNX → TFLite → NPUASVspoof 2019

Pipeline de entrenamiento

Pipeline de entrenamiento basado en PyTorch sobre ASVspoof 2019 Logical Access. EER <2% en validación. Ejecuciones reproducibles con hiperparámetros fijados, versionado de conjuntos de datos y control de semillas.

  • PyTorch + ASVspoof 2019 LA
  • Entrenamiento reproducible bajo control de semillas
  • Métrica EER rastreada a través de épocas

Cuantificación para ultra bajo consumo

Cuantificación post-entrenamiento a INT8 con conjunto de calibración. El tamaño del modelo se reduce en 4×, la latencia de inferencia se reduce de manera similar, mientras que la degradación de EER se mantiene por debajo del 0.5%.

  • PTQ con conjunto de calibración representativo
  • Degradación de EER <0.5% post-cuantificación
  • Huella de memoria adecuada para NPU embebida

Despliegue en NPU

Exportación ONNX → Intermedio TFLite → Conversión de formato de proveedor NPU. Validado en proveedor UE NPU embebida y otros aceleradores de bajo consumo. Latencia de inferencia <30 ms por fotograma de audio.

  • ONNX como formato de intercambio
  • TFLite como intermedio
  • Integración de tiempo de ejecución NPU específica del proveedor