Ponente
Descripción
RESUMEN:
El uso de inteligencia artificial (IA) en el ámbito médico ha crecido notablemente, pero también ha generado inquietudes respecto a la falta de transparencia en sus decisiones. Para atender esta necesidad, han surgido técnicas de inteligencia artificial interpretativa, como Grad-CAM, que permiten visualizar las regiones de una imagen que influyen en la predicción de un modelo.
En este estudio se desarrollaron clasificadores de parálisis facial mediante tres arquitecturas de redes neuronales convolucionales. Posteriormente, se aplicó Grad-CAM para interpretar visualmente las predicciones, identificando las zonas del rostro que motivaron la clasificación. Esto permitió verificar si dichas áreas eran coherentes con los signos clínicos de la afección.
Para la creación de los clasificadores se emplearon redes neuronales convolucionales (CNN) junto con técnicas propias del deep learning, como transfer learning y fine-tuning. En una primera etapa, se construyó un clasificador binario utilizando transfer learning, cuyo objetivo fue determinar la presencia o ausencia de parálisis facial en una persona. En la segunda etapa, se aplicó fine-tuning a dos clasificadores adicionales: el primero, un clasificador binario diseñado para evaluar la severidad de la parálisis, distinguiendo entre casos leves y graves; y el segundo, un clasificador multi-etiqueta, encargado de identificar tanto la zona afectada del rostro como el grado de severidad de la parálisis.
Este proyecto contribuye al desarrollo de sistemas de diagnóstico médico más confiables, interpretables y transparentes, que fortalecen la confianza de los profesionales de la salud en el uso de herramientas basadas en inteligencia artificial.
Palabras clave: Grad-CAM, parálisis facial, inteligencia artificial interpretativa, redes neuronales convolucionales, transfer learning, fine tuning.