Análisis del riesgo temporal de deserción escolar mediante modelos de supervivencia con datos sintéticos: un estudio metodológico basado en simulación

Autores/as

  • Mayra Fernanda Romero Morales Universidad de Investigación e Innovación de México image/svg+xml Author

DOI:

https://doi.org/10.66465/hispasci.1.2026.4

Palabras clave:

análisis de supervivencia, deserción escolar, datos sintéticos, modelos de Cox, simulación estadística

Resumen

El presente estudio tiene como objetivo analizar el riesgo temporal de deserción escolar mediante modelos de supervivencia, utilizando datos sintéticos generados bajo un proceso estocástico controlado. El enfoque metodológico se basa en la simulación de trayectorias educativas individuales, incorporando covariables socioeconómicas y académicas plausibles, tales como nivel socioeconómico, rezago académico, educación de los padres y condición de ruralidad. Se especifica un proceso generador de datos con función de riesgo base Weibull, lo que permite capturar dinámicas temporales flexibles y niveles realistas de censura. Sobre los datos simulados se estiman un modelo de riesgos proporcionales de Cox y un modelo paramétrico Weibull AFT, evaluando la recuperación de parámetros, la significancia estadística de los efectos y el desempeño predictivo mediante el índice de concordancia. Los resultados evidencian coherencia entre los parámetros verdaderos y los estimados, con una tasa de eventos del 69 %, adecuada para el análisis de deserción escolar, y un desempeño predictivo moderado (C-index ≈ 0.65). Asimismo, las pruebas de supuestos confirman la validez del enfoque de riesgos proporcionales. Se concluye que el uso de datos sintéticos constituye una estrategia metodológica robusta para evaluar modelos de supervivencia en contextos educativos, permitiendo analizar propiedades estadísticas, estabilidad y capacidad explicativa de los modelos sin depender de datos observacionales sensibles o restringidos. El estudio aporta un marco reproducible y extensible para investigaciones metodológicas y aplicaciones empíricas en el análisis del abandono escolar.

Referencias

Austin, P. C. (2012). Generating survival times to simulate Cox proportional hazards models with time-varying covariates. Statistics in Medicine, 31(29), 3946–3958. https://doi.org/10.1002/sim.5452

Bewick, V., Cheek, L., & Ball, J. (2004). Statistics review 12: Survival analysis. Critical Care, 8(5), 389–394. https://doi.org/10.1186/cc2955

Burton, A., Altman, D. G., Royston, P., & Holder, R. L. (2006). The design and reporting of simulation studies in medical research. Statistics in Medicine, 25(24), 4279–4292. https://doi.org/10.1002/sim.2673

Cox, D. R. (1972). Regression models and life-tables. Journal of the Royal Statistical Society: Series B (Methodological), 34(2), 187–220. https://doi.org/10.1111/j.2517-6161.1972.tb00899.x

Davidson-Pilon, C. (2019). lifelines: Survival analysis in Python. Journal of Open Source Software, 4(40), 1317. https://doi.org/10.21105/joss.01317

Harrell, F. E., Califf, R. M., Pryor, D. B., Lee, K. L., & Rosati, R. A. (1982). Evaluating the yield of medical tests. JAMA, 247(18), 2543–2546. https://doi.org/10.1001/jama.1982.03320430047030

Jaeger, M. M. (2011). Does cultural capital really affect academic achievement? New evidence from combined sibling and panel data. Sociology of Education, 84(4), 281–298. https://doi.org/10.1177/0038040711417010

Leung, K. M., Elashoff, R. M., & Afifi, A. A. (1997). Censoring issues in survival analysis. Annual Review of Public Health, 18, 83–104. https://doi.org/10.1146/annurev.publhealth.18.1.83

Morales Torres, I. F. (2025). Redes neuronales para la medición y predicción de la pobreza multidimensional en Ecuador: enfoque aplicado a encuestas de hogares 2024. Nexus Research Journal, 4(2), 297–318. https://doi.org/10.62943/nrj.v4n2.2025.414

Morales Torres, I. F., & Pow Chon Long Vásquez, D. F. (2012). Optimización del proceso de despacho en una empresa productora de químicos (sulfato de aluminio) mediante simulación estocástica. http://www.dspace.espol.edu.ec/xmlui/handle/123456789/36369

Morris, T. P., White, I. R., & Crowther, M. J. (2019). Using simulation studies to evaluate statistical methods. Statistics in Medicine, 38(11), 2074–2102. https://doi.org/10.1002/sim.8086

Mustefa, Y. A., & Chen, D. G. (2021). Accelerated failure-time model with weighted least-squares estimation: Application on survival of HIV positives. Archives of Public Health, 79, 88. https://doi.org/10.1186/s13690-021-00617-0

Peduzzi, P., Concato, J., Feinstein, A. R., & Holford, T. R. (1995). Importance of events per independent variable in proportional hazards regression analysis II. Accuracy and precision of regression estimates. Journal of Clinical Epidemiology, 48(12), 1503–1510. https://doi.org/10.1016/0895-4356(95)00048-8

Rubin, D. B. (1996). Multiple imputation after 18+ years. Journal of the American Statistical Association, 91(434), 473–489. https://doi.org/10.1080/01621459.1996.10476908

Rykov, V., Ivanova, N., & Morozov, E. (2025). Performance and Numerical Analysis of (GI| GI| N, M) Queues using Marked Markov Process. Reliability: Theory & Applications, 20(85), 61-82. https://doi.org/10.24412/1932-2321-2025-885-61-82

Skidmore, S. T., & Thompson, B. (2010). Statistical techniques used in published articles: A historical review of reviews. Educational and Psychological Measurement, 70(5), 777–795. https://doi.org/10.1177/0013164410379320

Vaupel, J. W., Manton, K. G., & Stallard, E. (1979). The impact of heterogeneity in individual frailty on the dynamics of mortality. Demography, 16(3), 439–454. https://doi.org/10.2307/2061224

Descargas

Publicado

2026-01-15

Número

Sección

Artículos de Investigación