Resumo:
Actualmente, impulsados por los avances tecnológicos en la adquisición, el procesamiento, el almacenamiento y la difusión de datos, las organizaciones disponen de conjuntos de datos cada vez más grandes y complejos. Entonces, para encontrar la información requerida, descubrir patrones novedosos y realizar una categorización se hace uso de las técnicas de descubrimiento de conocimiento en bases de datos (Knowledge Discovery in Databases - KDD) y data mining.
En particular, la utilización de data mining en bases de datos hospitalarias tiene un gran potencial para explorar patrones ocultos en conjuntos de datos de dominio médico debido a su naturaleza voluminosa, heterogénea y distribuida. Estos patrones se pueden utilizar para el diagnóstico clínico y gestión de recursos, entre otros. Dada la situación de pandemia que se ha vivido recientemente, el descubrimiento de conocimiento para la eficiencia en la toma de decisiones se vuelve imprescindible.
El presente trabajo final tiene como objetivo hacer un aporte a la gestión en salud dentro de la comunidad de Mar del Plata haciendo uso de bases de datos vinculadas al COVID-19 de carácter público y privado. El uso de información privada fue posible gracias a la colaboración y buena predisposición del Hospital Privado de Comunidad (HPC).
A lo largo del proyecto se expone tanto la investigación, evaluación e implementación de métodos de data mining y descubrimiento de conocimiento como el análisis, documentación y visualización de los resultados obtenidos. Especialmente, se utilizan técnicas de clustering como k-means, k-prototypes y una red neuronal artificial en el paradigma del aprendizaje competitivo no supervisado, los mapas auto-organizados de Kohonen (SOM), obteniéndose mapas de alta calidad que permiten realizar un análisis profundo de un gran volumen de información en base de datos a nivel nacional y local.
Además, se ha aplicado una técnica híbrida que combina SOM y k-means con fines de refinamiento.
Los resultados de k-prototypes permitieron obtener un panorama general de la distribución de las muestras, mientras que en los mapas auto-organizados, con medidas de evaluación de modelos de gran calidad, posibilitaron un análisis más completo y profundo.
Finalmente, se presenta un software desarrollado en MATLAB© para que los expertos puedan hacer un mayor estudio de los resultados.
Mail de los autores Ferraris Ignacio <ferrarisnacho@gmail.com>; Gabbanelli Lucia <luuucia3@gmail.com>