Predicción de la esperanza de vida en municipios andaluces mediante análisis de indicadores multidimensionales
Author:
Iglesias Martín, MercedesDirector:
Venegas Pardo, MartaDate:
2025-09Keyword(s):
Abstract:
Este Trabajo Fin de Máster tiene como objetivo predecir la esperanza de vida al nacimiento en los municipios andaluces utilizando técnicas de aprendizaje automático. Para ello se recopilaron datos socioeconómicos, demográficos y geográficos de diferentes fuentes oficiales, que posteriormente fueron preprocesados y analizados mediante un estudio exploratorio. Se aplicaron distintas estrategias de reducción de dimensionalidad, como la selección de variables por correlación y VIF, así como el Análisis de Componentes Principales (PCA). Además, se construyó un conjunto adicional de predictores a partir de los resultados del análisis exploratorio. Con estos conjuntos de datos se entrenaron y evaluaron diferentes modelos: Random Forest, XGBoost, Procesos Gaussianos y Redes Neuronales. Los resultados muestran que las redes neuronales, especialmente con un conjunto reducido de variables muy correlacionadas con la esperanza de vida, ofrecieron el mejor rendimiento en términos de precisión y capacidad de generalización. No obstante, los conjuntos más amplios también resultaron relevantes al capturar la complejidad del fenómeno.
Este Trabajo Fin de Máster tiene como objetivo predecir la esperanza de vida al nacimiento en los municipios andaluces utilizando técnicas de aprendizaje automático. Para ello se recopilaron datos socioeconómicos, demográficos y geográficos de diferentes fuentes oficiales, que posteriormente fueron preprocesados y analizados mediante un estudio exploratorio. Se aplicaron distintas estrategias de reducción de dimensionalidad, como la selección de variables por correlación y VIF, así como el Análisis de Componentes Principales (PCA). Además, se construyó un conjunto adicional de predictores a partir de los resultados del análisis exploratorio. Con estos conjuntos de datos se entrenaron y evaluaron diferentes modelos: Random Forest, XGBoost, Procesos Gaussianos y Redes Neuronales. Los resultados muestran que las redes neuronales, especialmente con un conjunto reducido de variables muy correlacionadas con la esperanza de vida, ofrecieron el mejor rendimiento en términos de precisión y capacidad de generalización. No obstante, los conjuntos más amplios también resultaron relevantes al capturar la complejidad del fenómeno.
Collections
Files in this item



