Escenario: una planta con 100 tanques en distintos niveles (Bajo/Medio/Alto) y calidad (Buena/Regular/Mala). Se crea el MDP, se generan estados y transiciones, se entrena por lotes y se resuelve la política óptima. Luego se consulta la acción recomendada para estados operativos y de emergencia. Resultados esperados: para T12_Medio_Regular suele recomendarse EncenderBomba y para T55_Alto_Mala suele recomendarse AbrirValvula, según las recompensas definidas.
Asegúrate de tener el servidor ejecutándose antes de llamar a la API.