Resumo:
Los algoritmos de aprendizaje profundo intentan aprender caracteristicas jerarquicas, correspondientes a diferentes niveles de abstraccion. El progreso actual en los modelos de aprendizaje profundo, especificamente en las arquitecturas de redes neuronales convolucionales profundas (CNN), ha mejorado el estado del arte en muchos campos de estudio, incluida la clasificacion de escenas de sensado remoto. La eleccion de una arquitectura de red adecuada para hacer suposiciones sólidas y correctas sobre la naturaleza de los datos de entrada sigue siendo un gran desafío. Este trabajo presenta implementaciones de la CNN AlexNet, la cual se entreno en los conjuntos de datos UC Merced Land Use y WHU-RS mediante el uso de la técnica de Transfer Learning para el problema de clasificación de
escenas urbanas de imágenes de alta resolución espacial a clasificar. Se incorpora una capa correspondiente a Spatial Pyramid Pooling (SPP) para hacer uso de diferentes tamaños de imágenes en la entrada a la red. Los resultados son comparables a la literatura, mejorando algunos enfoques publicados.
Mail autores Ayrton Betti <ayrtonbetti@mdp.edu.ar> y Rocio Guiraldez <rociogiraldez@mdp.edu.ar>