El modelo de Asignación Latente de Dirichlet: fundamentos, tendencias y desafíos

Autores/as

DOI:

https://doi.org/10.22201/fesa.29928273e.2026.12.103

Palabras clave:

Asignación Latente de Dirichlet, aprendizaje automático, modelo temático, Web of Knowledge, análisis bibliométrico.

Resumen

El artículo presenta avances de investigación del marco teórico y estado del arte de un proyecto de tesis de maestría en ingeniería. Como parte de ese trabajo, se propone una herramienta libre y desarrollada en la nube, mediante la cual los usuarios, sin conocimientos técnicos ni de programación avanzados, puedan desarrollar proyectos de modelado temático mediante el algoritmo de Asignación Latente de Dirichlet (LDA, por su nombre en inglés). Para ello, se describen los fundamentos teóricos y se realiza un análisis bibliométrico con base en la información de 2 113 documentos publicados entre 2002 y 2024, recuperados de la plataforma Web of Knowledge, para identificar sus tendencias, aplicaciones y áreas de oportunidad. Uno de los hallazgos es el uso creciente del modelo LDA en diversas disciplinas, debido a su precisión y confiabilidad; pero también se identificaron áreas de oportunidad relevantes para implementarlo en los campos de las ciencias sociales y humanidades, en proyectos de investigación interdisciplinarios.

Citas

Aria, M., & Cuccurullo, C. (2017). bibliometrix: An R-tool for comprehensive science mapping analysis. Journal of Informetrics, 11(4), 959-975. https://doi.org/10.1016/J.JOI.2017.08.007

Asmussen, C. B., & Møller, C. (2019). Smart literature review: a practical topic modelling approach to exploratory literature review. Journal of Big Data, 6(1). https://doi.org/10.1186/s40537-019-0255-7

Barde, B. V., & Bainwad, A. M. (2017, 15-16 June). An overview of topic modeling methods and tools. 2017 International Conference on Intelligent Computing and Control Systems, ICICCS, Madurai, India, 745-750. https://doi.org/10.1109/ICCONS.2017.8250563

Biblioteca Digital UNAM. (2025, 20 de diciembre). Journal Citation Reports: Science Edition. Universidad Nacional Autónoma de México. https://www.bidi.unam.mx/index.php/colecciones-digitales/bases-de-datos/ver-todos-los-recursos/555-journal-citation-reports-science-edition-full

Blei, D. M., Ng, A. Y., & Edu, J. B. (2003). Latent Dirichlet Allocation Michael I. Jordan. In Journal of Machine Learning Research (Vol. 3).

Clarivate. (2025a). Detalle del artículo. https://support.clarivate.com/ScientificandAcademicResearch/s/article/Journal-Citation-Reports-Quartile-rankings-and-other-metrics?language=en_US

Clarivate. (2025b). Web of Science | Clarivate. https://clarivate.com/academia-government/scientific-and-academic-research/research-discovery-and-referencing/web-of-science/

Clarivate. (2025c). Web of Science: h-index information. https://support.clarivate.com/ScientificandAcademicResearch/s/article/Web-of-Science-h-index-information?language=en_US

Clarivate Analytics. (2025). Colección Principal de Web of Science. https://webofscience.help.clarivate.com/es-es/Content/wos-core-collection/wos-core-collection.htm

D’Amato, D., Droste, N., Allen, B., Kettunen, M., Lähtinen, K., Korhonen, J., Leskinen, P., Matthies, B. D., & Toppinen, A. (2017). Green, circular, bio economy: A comparative analysis of sustainability avenues. Journal of Cleaner Production, 168, 716-734. https://doi.org/10.1016/j.jclepro.2017.09.053

Dyer, T., Lang, M., & Stice-Lawrence, L. (2017). The evolution of 10-K textual disclosure: Evidence from Latent Dirichlet Allocation. Journal of Accounting and Economics, 64(2-3), 221-245. https://doi.org/10.1016/j.jacceco.2017.07.002

Guo, Y., Barnes, S. J., & Jia, Q. (2017). Mining meaning from online ratings and reviews: Tourist satisfaction analysis using latent Dirichlet allocation. Tourism Management, 59, 467-483. https://doi.org/10.1016/j.tourman.2016.09.009

Hirsch, J. E. (2005). An index to quantify an individual’s scientific research output. Proceedings of the National Academy of Sciences of the United States of America, 102(46), 16569-16572. https://doi.org/10.1073/PNAS.0507655102

Jelodar, H., Wang, Y., Yuan, C., Feng, X., Jiang, X., Li, Y., & Zhao, L. (2019). Latent Dirichlet Allocation (LDA) and topic modeling: models, applications, a survey. Multimedia Tools and Applications, 78(11), 15169-15211. https://doi.org/10.1007/s11042-018-6894-4

Lansley, G., & Longley, P. A. (2016). The geography of Twitter topics in London. Computers, Environment and Urban Systems, 58, 85-96. https://doi.org/10.1016/j.compenvurbsys.2016.04.002

Li, H. (2024). Latent Dirichlet Allocation. Machine Learning Methods, 439-471. https://doi.org/10.1007/978-981-99-3917-6_20

Moro, S., Cortez, P., & Rita, P. (2015). Business intelligence in banking: A literature analysis from 2002 to 2013 using text mining and latent Dirichlet allocation. Expert Systems with Applications, 42(3), 1314-1324. https://doi.org/10.1016/j.eswa.2014.09.024

Parra, M. (2021). Estudio bibliométrico en la base de datos Web of Science tendencias de producción bibliográfica en modalidades de educación virtual y educación a distancia durante el año 2019 [Tesis de maestría inédita]. Universidad La Salle, Bogotá. https://ciencia.lasalle.edu.co/maest_docencia

Qamar, U., & Raza, M. S. (2024). Introduction to Text Mining. Applied Text Mining, 3–24. https://doi.org/10.1007/978-3-031-51917-8_1

Serles, U., & Fensel, D. (2024). Natural Language Processing. An Introduction to Knowledge Graphs, 55-61. https://doi.org/10.1007/978-3-031-45256-7_6

Taecharungroj, V., & Mathayomchan, B. (2019). Analysing TripAdvisor reviews of tourist attractions in Phuket, Thailand. Tourism Management, 75, 550-568. https://doi.org/10.1016/j.tourman.2019.06.020

Xue, J., Chen, J., Chen, C., Zheng, C., Li, S., & Zhu, T. (2020). Public discourse and sentiment during the COVID 19 pandemic: Using Latent Dirichlet Allocation for topic modeling on Twitter. PLoS ONE, 15(9). https://doi.org/10.1371/journal.pone.0239441

Zong, C., Xia, R., & Zhang, J. (2021). Text Data Mining. Text Data Mining, 1-351. https://doi.org/10.1007/978-981-16-0100-2/COVER

Descargas

Publicado

01-10-2025

Cómo citar

Franco Salido, G. ., & Macedo Chagolla, F. (2025). El modelo de Asignación Latente de Dirichlet: fundamentos, tendencias y desafíos. RDP Revista Digital De Posgrado, (12), 27–53. https://doi.org/10.22201/fesa.29928273e.2026.12.103

Número

Sección

Artículos