Heurística de ajuste y análisis de convergencia del algoritmo de aprendizaje por refuerzo para el proyecto de control óptimo basado en datos online. (2020). Research, Society and Development, 9(2), e188922128. https://doi.org/10.33448/rsd-v9i2.2128