SciELO - Scientific Electronic Library Online

 
vol.33 issue6Phytochemical study of Cnidoscolus urens (L.) Arthur from Cucuta´s region (Colombia)Noise reduction in the calculation of nuclear reactivity with a digital filter and Gauss-Legendre quadrature author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Información tecnológica

On-line version ISSN 0718-0764

Inf. tecnol. vol.33 no.6 La Serena Dec. 2022

http://dx.doi.org/10.4067/S0718-07642022000600031 

ARTICULOS

Aplicación de técnicas de minería de datos para determinar un modelo de operación de un turbogenerador hidráulico

Application of data mining techniques to define an operating model for a hydraulic turbogenerator

Redy H. Risco1 

Daniel A. Pérez1 

Luis A. Casaverde1 

Gerson La-Rosa1 

1 Universidad de Piura, Piura-Perú (correo-e: redy.risco.r@alum.udep.edu.pe; daniel.perez.a@alum.udep.edu.pe; luis.casaverde@alum.udep.edu.pe; gerson.larosa@udep.edu.pe)

Resumen:

Este estudio aplica un modelo de referencia que implementa la minería de datos como parte de un entorno de inteligencia de negocios para analizar la operación de un turbogenerador hidráulico. Los datos analizados provienen del sistema de control y adquisición de datos de una central hidroeléctrica. Se genera un modelo utilizando análisis de componentes principales. Luego, se evalúa el modelo con nuevas observaciones utilizando los gráficos de control estadístico multivariante: cuadrado del error de predicción y T2 de Hotelling y finalmente se implementa el análisis conectando las tablas generadas con una herramienta convencional de inteligencia de negocios. El modelo se prueba en cinco muestras correspondientes a periodos previos a una parada del turbogenerador. Se concluye que el modelo de referencia utilizado puede ser aplicado al análisis de la operación de un turbogenerador hidráulico, que los gráficos de control son capaces de detectar comportamientos atípicos de operación y que es necesario el conocimiento del proceso a analizar para una adecuada interpretación de los resultados.

Palabras clave: minería de datos; control estadístico multivariante; análisis de componentes principales; gráficos de control estadístico

Abstract:

This study applies a reference model that implements data mining as part of a business intelligence environment to analyze the operation of a hydraulic turbogenerator. Data is obtained from the control and data acquisition system of a hydroelectric power plant. A model is first generated using a principal component analysis. Then, it is evaluated with new observations by using squared prediction error multivariate statistical control graphs and the Hotelling’s T2, and finally the analysis was implemented by connecting the tables generated by a conventional business intelligence tool. The model was tested on five samples corresponding to periods prior to a turbogenerator shutdown. It is concluded that the reference model presented here can be applied to analyze the operation of a hydraulic turbogenerator, that the control charts can detect atypical operating behaviors, and that previous understanding of the analyzed process is necessary for an adequate interpretation of the results.

Keywords: data mining; multivariate statistical control; principal component analysis; statistical control charts

INTRODUCCIÓN

En la actualidad en muchos procesos industriales se cuenta con un sistema de supervisión, control y adquisición de datos (SCADA). Tal como se indica en Yadav y Paul, (2021) un sistema SCADA está constituido por elementos hardware y software; el hardware incluye unas unidades terminales tanto remotas como maestras, actuadores y sensores, y el software incluye principalmente la interfaz hombre-máquina (HMI), una base de datos central (con datos históricos de las variables del proceso y de los eventos del mismo) y además un software cliente para visualización y control. En muchas industrias la base de datos histórica no es aprovechada, pues se trata de muchos datos que un operador con herramientas visuales básicas no puede analizar. Para aprovechar estos datos históricos y poder obtener de ellos información y conocimiento relevante que permita tomar decisiones; existen procesos, arquitecturas y tecnologías que en conjunto se les denomina inteligencia de negocios (o BI por las siglas en inglés de Business Intelligence) tal como se define en Muntean et al., (2021) y Wixom y Watson, (2010). La inteligencia de negocios va enlazada con la analítica de negocios que incluye entre otras herramientas, la minería de datos.

En Mishra et al., (2017) y Schuh et al., (2019) se define la minería de datos como el proceso de descubrimiento de conocimiento existente en una base de datos, conocimiento que puede ser utilizado en la toma de decisiones. La minería de datos da una visión de las situaciones pasadas y presentes y una comprensión de los posibles resultados futuros que pueden dar resultados efectivos, ayuda a descubrir hechos desconocidos que están allí en la base de datos y que a simple vista no pueden ser apreciados. En Matos et al., (2006) se presenta una metodología para descubrir conocimiento a partir de los datos en una metodología que denominan KM-IRIS aplicada a diferentes fuentes de datos. Otra forma sistemática de desarrollar una solución de minería de datos es seguir el modelo de referencia CRISP-DM (siglas del inglés Cross-Industry Standard Process for Data Mining), las fases de este modelo se muestran en Schröer et al., (2021) cuyo resumen se muestra en la Tabla 1.En Wiemer et al., (2019) se plantean unas fases y sub-fases para la aplicación del modelo a soluciones de ingeniería que tomamos en cuenta en nuestra implementación, estos complementos se muestran en la Fig. 1

Tabla 1 Etapas del Modelo CRISP-DM. (Adaptada de Schröer et al., 2021

En el presente trabajo se desarrolla la aplicación del modelo de referencia CRISP-DM como parte de una implementación de inteligencia de negocios a los datos provenientes de la operación de un turbogenerador hidráulico. Un turbogenerador es el equipamiento principal de una central hidroeléctrica y tal como se indica en Betti et al., (2021) dentro de las energía renovables, la hidráulica tiene muchas ventajas como son: una larga vida útil, flexibilidad, bajos costos de operación y mantenimiento, eficiencias de alrededor del 90%. En el 2016 la energía hidráulica tuvo un porcentaje de participación en el suministro energético mundial del 13%; en el Perú, según el anuario estadístico de electricidad del año 2020 del Ministerio de Energía y Minas MINEM, (2021), la energía hidráulica representó el 58 % de la producción energética eléctrica nacional. Por otro lado, Betti et al., (2021) plantea que para al 2030 muchas de las centrales deben actualizarse o modernizarse y por lo tanto tienen el reto de optimizar diversos procesos dentro de los que está el manejo y aprovechamiento de la gran cantidad de datos disponibles a partir de estas modernizaciones.

Este artículo de manera similar al de Betti et al., (2021) y González et al., (2020) tiene la finalidad de generar un modelo que permita detectar un funcionamiento anormal del turbogenerador a partir de los datos provenientes de sus operaciones. El modelo de operación es generado utilizando el análisis de componentes principales y la evaluación de nuevas observaciones o nuevos puntos de operación se realiza con dos gráficos de control estadístico de procesos multivariante: 1) el cuadrado del error de predicción (al que nombraremos SPE por sus siglas en inglés tal como puede ser encontrado en la literatura del tema) y 2) el gráfico basado en el cálculo del estadístico T2 de Hotelling, planteados en Kourti, (2020) y usado también en Fontalvo et al., 2020

Fig. 1: Modelo de referencia CRISP-DM con extensión para aplicaciones de ingeniería. (Adaptado de Wiemer et al., 2019

El aporte de este trabajo es la utilización de un procedimiento de inteligencia de negocios, específicamente de minería de datos, aplicando el modelo de referencia CRISP-DM a los datos provenientes de la operación de un turbogenerador de una central hidroeléctrica de mediana potencia en la región norte del Perú; con el objetivo de aprovechar los datos provenientes del sistema SCADA de la central que durante años de operación no vienen siendo analizados ni aprovechados para este fin. Obviamente esta metodología puede ser aplicada a otras unidades de generación e incluso a otros procesos multivariantes.

METODOLOGÍA

En esta sección se procede a la aplicación de la metodología basada en el modelo de referencia CRISP-DM siguiendo todas las fases de este modelo de referencia tal como fue desarrollado en su concepción inicial y aunque no se incluye explícitamente los pasos del modelo propuesto en Wiemer et al., (2019) mostrado en la Fig.1, si se está considerando la conceptualización y conocimiento del proceso analizado en el estudio del caso.

Fase 1: Entendiendo el negocio

El negocio o proceso por analizar es la operación de una unidad de generación hidráulica (turbogenerador) de una central hidroeléctrica de 12.5 MW en la ciudad de Piura, Perú. La central cuenta con dos unidades de generación cada una compuesta por una turbina Kaplan de 6.25 MW y un generador síncrono de 7.5 MVA acoplados en eje vertical. La central opera las 24 horas de día los 7 días de la semana en función de la disponibilidad hídrica y cuenta con un sistema SCADA que recolecta información de diferentes sensores que permiten el control y monitoreo de la operación de las unidades.

Una óptima operación de las unidades debe evitar paradas intempestivas, por ello el objetivo de la aplicación de la minería de datos es encontrar un patrón de operación normal de cada unidad de generación en función a los datos proporcionados por los sensores de las unidades a fin de alertar cualquier comportamiento anormal que pueda implicar una parada intempestiva o no programada. Para el análisis y determinación del patrón de operación hemos realizado primero una reducción dimensional utilizando uno de los métodos tradicionales de control estadístico de procesos multivariantes como es el análisis de componentes principales, que es un método basado en datos, cuantitativo y estadístico según Mirnaghi y Haghighat, (2020).

El patrón de operación se modelará utilizando las gráficas de control multivariante para el control estadístico de calidad: T2 de Hotteling y el Error de Predicción al Cuadrado (SPE, en inglés). Para evaluar el proceso se sigue el procedimiento planteado en Kourti, (2020): un conjunto de datos consistentes de proceso en operación normal es utilizado como conjunto de datos de entrenamiento con los que se genera un modelo. Luego con datos proveniente de nuevas observaciones y utilizando información del modelo se calculan parámetros y nuevos puntos en los gráficos T2 y SPE, si estos puntos no superan los valores límite el proceso está en operación normal. En esta fase debemos tomar en cuenta el conocimiento técnico de la operación de las unidades en esta central a fin de elegir los datos necesarios para un adecuado modelado. Es importante indicar que un adecuado modelado debe considerar periodos de operación continua, los mismos que se dan en épocas cuando el caudal es constante y suficiente para una operación de las unidades a potencia nominal y sin interrupciones. Esta época es en los meses entre enero y mayo de cada año normalmente.

Fase 2: Entendiendo los datos

Los datos son obtenidos de las siguientes fuentes: Del sistema SCADA en archivos con variables del proceso proveniente de los sensores de la unidad de generación (archivos generados automáticamente cada día con registros de datos cada 10 segundos de todo un año de operación, de junio de 2020 a junio de 2021 en formato .DBF. De los reportes de control de paradas de unidad de todo un año de operación y en el mismo periodo de la fuente anterior. Se trata de archivos Excel generados por los operadores de la central. De la documentación de la planta correspondiente a la información tal como quedó construido el sistema de control (esta información es la llamada información “Como Construido” o “CC”) se obtiene el archivo de definición de señales del sistema de control en formato .xls.

Fase 3: Preparación de los datos

La preparación consistió en elegir periodos de operación normal en los meses de alta disponibilidad del recurso hídrico, que para el 2021 correspondió a los meses entre febrero y abril. De la documentación de la planta correspondiente a la información como construido, se identificó la descripción de las medidas de cada sensor según su código, etiqueta o “tag”. La lista de las 40 variables utilizadas en la generación del modelo se puede observar en la Tabla 2.

Para la preparación de los datos se utilizó el software R y sus librerías “foreign” y “openxlsx” para cargar los datos desde los archivos fuente en extensión “*.dbf” y “*.xlsx”. Los datos son limpiados manualmente retirando aquellas variables cuyos sensores presentan valores nulos, negativos o en unidades no configuradas. Con esto se quedan finalmente 40 variables. Además, se considera operación normal aquella operación que no vierte agua por el vertedero de demasías, operación que se registra con la variable BQ4101 (Nivel de agua en cámara de carga) menor o igual a 63.90 msnm.

Tabla 2 Señales de control del proceso según la información Como Construido. 

El modelo seguido es el planteado en Lee y Jemain, (2021) para un análisis de componentes principales donde la matriz de datos tiene la forma mostrada en la Fig. 2 y el modelo resultante es planteado en la ecuación (1). En la ecuación (1), X es una matriz de (N x Y) con las variables estandarizadas (media cero y desviación estándar 1), T es una matriz (N x A) de N “scores” o proyecciones sobre A componentes principales, P es una matriz (P x A) de P “loadings” o pesos de las A componentes principales y E es una matriz (N x P) residuos. El cálculo de las matrices se hace en R. El estandarizado se realiza con la librería “scales”, las matrices T y P se calculan con la función “prcomp”, esta función calcula la matriz “rotation” que contienen los pesos o “loadings” y la matriz “P” que contiene las proyecciones sobre las componentes principales o “principal component scores”. Para mostrar gráficamente la varianza explicada de cada componente principal se utilizó la librería “factoextra”.

Fig. 2: Típico arreglo de la matriz de datos. (Adaptado de Lee y Jemain, 2021

()1

Previamente al modelado se han seleccionado 3 semanas de cada mes entre febrero y abril con operación continua, de esta muestra se han considerado para el modelo, aquellas muestras con nivel de agua al ingreso de la central con cota menor o igual a 63.90msnm, esto generó una muestra con N = 168798 observaciones. Se considera esta cota pues si el nivel de agua supera este valor, el vertedero de demasías empieza a operar, es decir, a descargar agua que no será aprovechada para la generación de energía. El número de A componentes principales que se utilizará para el modelo será aquel que tenga una varianza explicada acumulada mayor al 90% que en este caso se logra con 10 componentes principales tal como se muestra en la Fig. 3. El cálculo de la suma acumula de varianza de los 10 componentes es de 90.9%.

Fig. 3: Porcentaje de varianza explicada acumulada por cada componente principal. 

Fase 4: Modelado

Con las A componentes principales definidas en la fase anterior, el modelo resultante sería el indicado en la ecuación (2) y las nuevas muestras serán modeladas según la ecuación (3).

()2

()3

Fase 5: Evaluación

La evaluación del modelo se ha realizado utilizando unos periodos de operación previos a eventos anómalos, estos períodos les hemos denominado muestras (ver Tabla 6), para la evaluación de las nuevas muestras, se usan dos gráficos de control estadístico utilizados en procesos multivariantes, se trata de el T2 de Hotelling y el cuadrado del error de predicción (SPE) planteados en Kourti, (2020), según las ecuaciones (4) y (5). Nótese que en la ecuación (5) el T2 de Hotelling corresponde a A componentes principales.

()4

()5

Para el cálculo de los límites de control superior (se nombran a estos límites con el subíndice UCL) se utilizan expresiones matemáticas planteadas en Kourti, (2020), que son: la simplificación de Nomikos y MacGregor. La ecuación (6) muestra la expresión para cálculo del límite de control superior del SPE y la ecuación (7) expresión para el cálculo del límite de control superior para el T2 de Hotelling. En la ecuación (6) v es la varianza de los datos, m es la media de los SPEi y X2 α es la distribución Chi cuadrado calculada con niveles de significancia alpha.

()6

Los cálculos y gráficos de control han sido realizados en Excel, debido a la facilidad que da para generar gráficos editables, ingresando los resultados obtenidos en R y utilizando las funciones mostradas en la Tabla 3. En la ecuación (7) el límite superior es calculado en base a los A primeros componentes principales y derivadas de N observaciones obtenidas usando una distribución F con niveles de significancia alpha. Los valores límite obtenidos se muestran en la Tabla 4 y Tabla 5.

()7

Tabla 3 Funciones Excel utilizadas para el cálculo de la distribución Chi cuadrado y distribución F 

Tabla 4 Valores calculados utilizando Excel y sus funciones, para los límites de control superior del SPE 

Tabla 5 Valores calculados utilizando Excel y sus funciones, para los límites de control superior del T2 de Hotelling 

Con el modelo generado en base a las 168798 observaciones y considerando las 10 primeras componentes principales se analizan los 5 conjuntos de observaciones (muestras) descritas en la Tabla 6. Los resultados de las evaluaciones de cada una de las muestras para los dos gráficos estadísticos de control se pueden observar en las figuras desde la 4 hasta la 13. En estas figura hemos nombrado SPE_X al cuadrado del error de predicción de la observación a evaluar y T2_X al valor T2 de Hotelling para la observación a evaluar, los límites de control en cada grafico han sido nombrados como SPE_(UCL_95%) y SPE_(UCL_99%) para el caso del cuadrado del error de predicción y T2_(UCL_95%) y T2_(UCL_99%) para el caso del T2 de Hotelling, ambos límites se han definido con un nivel de confiabilidad de 95% (alpha=0.05) y 99%(alpha=0.01) y permanecen constantes en cada evaluación.

Tabla 6 Muestras de evaluación 

Fase 5: Implementación

Esta fase tiene la finalidad de visualización del comportamiento de nuevas observaciones con fines de supervisión y mantenimiento, se ha elaborado con las tablas generadas en R (archivos “*.xlsx”) conectadas a una herramienta de inteligencia de negocios, en este caso, Microsoft Power BI, tal como ya se ha hecho en Ayad et al., (2020). En Power BI se elaboraron dos visualizaciones correspondientes a las dos graficas de control más dos visores con los límites de control integrados en un tablero de control de observaciones, con carga de datos no en tiempo real. Al final de la sección resultados se muestran los resultados de esta implementación.

RESULTADOS Y DISCUSIÓN

Los resultados de las evaluaciones de cada una de las muestras para los dos gráficos estadísticos de control se pueden observar a continuación. La Fig. 4 muestra que la operación está dentro del modelo generado, mientras que la Fig. 5 muestra que las observaciones previas a la parada de unidad si se encuentra en muchos puntos por encima de los limites T2 de Hotelling, que indican una operación anormal varias horas anteriores a la parada para este ajuste.

Fig. 4.Gráfico SPE - Muestra 1: Operación previa a calibración de álabes (26/02/2021 17:03). 

Fig. 5 Gráfico T2 de Hotelling - Muestra 1: Operación previa a calibración de álabes (26/02/2021 17:03). 

La Fig. 6 y la Fig. 7 corresponden a una operación de la unidad descargando agua por el vertedero de demasías al existir más recurso hídrico que el que la turbina puede utilizar. En la Fig. 6 el modelo muestra un pico entre el 17/03 y 07/04 y corresponde a una parada de unidad ocurrida el 18/03 entre las 16:30 y 16:38. La Fig. 7 en cambio muestra que los puntos cuando se superan los límites superiores de control ocurren cuando el caudal descargado es alto (nivel de agua en una cota mayor a 64.00 msnm).

Fig. 6 Gráfico SPE - Muestra 2: Operación con vertedero funcionando (diferentes días). 

Fig. 7 Gráfico T2 de Hotelling - Muestra 2: Operación con vertedero funcionando (diferentes días). 

La Fig. 8 y la Fig. 9 muestra que estas observaciones previas a la parada manual para limpieza y calibración se no superaban los límites de operación normal, el incremento mostrado a las 22:49:17 corresponde al proceso de parada de la unidad. Las Fig. 10 y la Fig. 11 muestran que la parada intempestiva por fallas en la unidad de alta presión del gobernador de la turbina no puede ser previsto con los datos disponibles. Las variables registradas no están incluyendo presiones del gobernador, por ejemplo. Correspondería sugerir la adquisición de estos datos como se tiene en instalaciones más modernas. En las Fig. 12 y Fig. 13 lo que se muestra es el comportamiento del modelo ante variaciones datos manuales (simulados). Estos incrementos pueden apreciarse con más claridad en el gráfico SPE, mientras que en el gráfico T2 de Hotelling estas variaciones se muestran más levemente.

Tal como se indica en la fase de implementación, para la interfaz con el usuario, se diseñó un tablero de control en Power BI mostrado en la Fig. 14. con los datos de la muestra 5. La visualización con la herramienta de BI resulta ser de más fácil despliegue y de rápido seguimiento y mantenimiento. Y permitiría hacer un seguimiento del comportamiento de los parámetros de control. Los resultados del presente trabajo presentados mediante las gráficas de control muestran qué tan alejadas están las nuevas observaciones del modelo generado. En la muestra 1, los resultados indican que el modelo obtenido detecta comportamientos anormales para condiciones de álabes descalibrados. En la Fig. 5 se pueden observar varias observaciones superando los limites superiores del gráfico T_2 de Hotelling.

Fig. 8 Gráfico SPE - Muestra 3: Operación previa a limpieza de rejillas y calibración de álabes (03/02/2021 22:46) 

Fig. 9 Gráfico T2 de Hotelling - Muestra 3: Operación previa a limpieza de rejillas y calibración de álabes (03/02/2021 22:46). 

Fig. 10 Gráfico SPE - Muestra 4: Operación previa a parada por falla en Unidad de Alta Presión. Parada a las 20:48:45 del 10/03/2021 

Fig. 11 Gráfico T2 de Hotelling - Muestra 4: Operación previa a parada por falla en Unidad de Alta Presión. Parada a las 20:48:45 del 10/03/2021 

Fig. 12 Gráfico SPE - Muestra 5 - Simulación de alteración de variables BT2515,BT3403,BT3404,BT2516 y comportamiento en parada y arranque de unidad del 10/03/2021 

Fig. 13 Gráfico T_2 de Hotelling - Muestra 5 - Simulación de alteración de variables BT2515,BT3403,BT3404,BT2516 y comportamiento en parada y arranque de unidad del 10/03/2021 

Fig. 14 Captura de pantalla del despliegue del Gráfico SPE - Muestra 5 en Power BI 

Para condiciones de operación con descarga de agua por el vertedero de demasías, el modelo muestra condiciones anormales a cotas de operación mayores a 64.00 msnm y con mayor exactitud a cotas mayores a 64.10 msnm (teniendo en cuenta que las cotas en las cuales el vertedero no opera son las menores o iguales a la cota 63.90msnm) (Ver Fig. 6 y Fig. 7). Las condiciones previas a la limpieza de rejillas y calibración de álabes analizadas en la muestra 3 no han mostrado claramente condiciones anormales, esto puede ser porque la parada pudo ser una parada programada como medida preventiva y no como medida correctiva como la de la muestra 1. Más detalles del proceso y mayor conocimiento de este son necesarios para un mejor análisis. La muestra 4 deja ver que el comportamiento previo a una falla intempestiva por falla en la Unidad de Alta Presión del gobernador de la turbina no es detectado por el presente modelo, esto se explica porque en las variables utilizadas por el modelo no hay variables relacionadas con este sistema. Sería importante agregar sensores de medición de estos parámetros para enriquecer el modelo, teniendo en cuenta esta posibilidad de ocurrencia.

En comparación con el trabajo de Betti et al., (2021), este trabajo utiliza reducción dimensional mediante el análisis de componentes principales para la aplicación de dos gráficos de control estadístico SPE y T2 de Hotelling, mientras que en Selak et al., (2014) se utiliza un algoritmo de aprendizaje supervisado el SVM (siglas en inglés de Support Vector Machine) y al ser un algoritmo supervisado requiere datos precalificados de operación para generalizar a nuevas condiciones de operación además de requerir una carga computacional alta tal como lo exponen los mismos autores, situaciones diferentes a las de nuestro trabajo. En la muestra 5 se hicieron unos incrementos intencionales en las variables que más influyen en el componente principal 1. Se observa en la Fig. 12 y en la Fig. 13 los resultados de estos incrementos en los gráficos de control. La gráfica de control SPE es la que más claramente muestra estas variaciones. Se muestra que ante estas posibles ocurrencias el modelo funcionaría correctamente.

La aplicación de esta metodología abarca todas aquellas áreas donde existan registros de parámetros históricos y tengan un proceso cuya falla intempestiva quiera ser evitado o prevenido. Las posibilidades son motores de combustión con mediciones de parámetros, equipos de refrigeración de alimentos, producción de etanol con molinos, calderos y equipos rotantes, entre otros.

CONCLUSIONES

De acuerdo con los resultados de este estudio se pueden extraer las siguiente tres conclusiones principales:

1) El modelo de referencia CRISP-DM empleado como modelo de desarrollo de una solución de minería de datos, utilizado en un sistema de control de unidades de generación hidráulica con un SCADA implementado, ha permitido aprovechar los datos disponibles para generar la información y conocimiento necesario para una toma de decisiones de operación oportuna.

2) No todas las situaciones y comportamientos anómalos pueden ser detectados, esto depende de que las variables del sistema causante de la anomalía estén contempladas en el modelo.

3) Aunque los modelos y despliegues pueden ser desarrollados con relativa facilidad con herramientas informáticas como las utilizadas en este trabajo, de todas maneras, el conocimiento del proceso a controlar o analizar es muy importante para un adecuado análisis e interpretación de resultados.

AGRADECIMIENTOS

R. H. Risco reconoce el apoyo financiero del Proyecto Concytec - Banco Mundial “Mejoramiento y Ampliación de los Servicios del Sistema Nacional de Ciencia Tecnología e Innovación Tecnológica” 8682-PE, a través de su unidad ejecutora ProCiencia. [contrato número 06-2018-FONDECYT/BM], para esta investigación ejecutada como parte del programa de Doctorado en Ingeniería con mención en Automatización, Control, y Optimización de Procesos de la Universidad de Piura.

REFERENCIAS

Ayad, H. A., Al-Kilani, L. A., y otros 4 autores, Developing an interactive data visualization platform to present the adaption of electrical vehicles in Washington, https://doi.org/10.1109/ICIEA49774.2020.9101928, 2020 IEEE 7th International Conference on Industrial Engineering and Applications (ICIEA), 2020,731-737 (2020) [ Links ]

Betti, A., Crisostomi, E., y otros 4 autores, Condition monitoring and predictive maintenance methodologies for hydropower plants equipment, https://doi.org/10.1016/j.renene.2021.02.102, Renewable Energy, 171, 246-253 (2021) [ Links ]

Fontalvo, T. J., Herrera, R., y Delahoz-Dominguez, E. J., Método de control estadístico multivariante para valorar las dimensiones de calidad en una empresa de lavado de tanques industriales, https://doi.org/10.4067/S0718-07642020000500109, Información Tecnológica, 31(5), 109-118 (2020) [ Links ]

González, H. A., Piedrahita, J. D., y Castrillón, O. D., Predicción de parada de máquinas generadoras en una central hidroeléctrica por medio de minería de datos, https://doi.org/10.4067/S0718-07642020000500215, Información Tecnológica, 31(5), 215-222 (2020) [ Links ]

Kourti, T., Multivariate statistical process control and process control, using latent variables, in Comprehensive Chemometrics, 2da Edición, Elsevier, ISBN 9780444641663, 275-303, Ontario, Canada (2020) [ Links ]

Lee, L. C., y Jemain, A. A., On overview of PCA application strategy in processing high dimensionality forensic data, https://doi.org/10.1016/j.microc.2021.106608 , Microchemical Journal, 169, 106608 (2021) [ Links ]

Matos, G., Chalmeta, R., y Coltell, O., Metodología para la extracción del conocimiento empresarial a partir de los datos, https://doi.org/10.4067/S0718-07642006000200011, Información Tecnológica, 17(2), 81-88 (2006) [ Links ]

MINEM., Anuario estadístico de electricidad 2020, Ministerio de Energía y Minas del Perú, http://www.minem.gob.pe (2021) [ Links ]

Mirnaghi, M. S., y Haghighat, F., Fault detection and diagnosis of large-scale HVAC systems in buildings using data-driven methods: A comprehensive review, https://doi.org/10.1016/j.enbuild.2020.110492, Energy and Buildings, 229, 110492 (2020) [ Links ]

Mishra, B. K., Hazra, D., Tarannum, K., y Kumar, M., Business intelligence using data mining techniques and business analytics, https://doi.org/10.1109/SYSMART.2016.7894496, Proceedings of the 5th International Conference on System Modeling and Advancement in Research Trends, SMART 2016, 84-89 (2017) [ Links ]

Muntean, M., Dănăiaţă, D., Hurbean, L., y Jude, C., A business intelligence & analytics framework for clean and affordable energy data analysis, https://doi.org/10.3390/su13020638, Sustainability, 13(2), 638 (2021) [ Links ]

Schröer, C., Kruse, F., y Gómez, J. M., A systematic literature review on applying CRISP-DM process model, https://doi.org/10.1016/j.procs.2021.01.199, Procedia Computer Science, 181, 526-534 (2021) [ Links ]

Schuh, G., Reinhart, G., y otros 5 autores, Data mining definitions and applications for the management of production complexity, doi:10.1016/j.procir.2019.03.217, Procedia CIRP, 81, 874-879 (2019) [ Links ]

Selak, L., Butala, P., y Sluga, A., Condition monitoring and fault diagnostics for hydropower plants, https://doi.org/10.1016/j.compind.2014.02.006, Computers in Industry, 65(6), 924-936 (2014) [ Links ]

Wiemer, H., Drowatzky, L., y Ihlenfeldt, S., Data mining methodology for engineering applications (DMME)-A holistic extension to the CRISP-DM model, https://doi.org/10.3390/app9122407, Applied Sciences, 9(12), 2407 (2019) [ Links ]

Wixom, B., y Watson, H., The BI-Based organization, doi: 10.4018/jbir.2010071702, International Journal of Business Intelligence Research, 1(1), 13-28 (2010) [ Links ]

Yadav, G., y Paul, K., Architecture and security of SCADA systems: A review, https://doi.org/10.1016/j.ijcip.2021.100433, International Journal of Critical Infrastructure Protection, 34, 100433 (2021) [ Links ]

Received: March 10, 2022; Accepted: May 17, 2022

* Autor a quien debe ser dirigida la correspondencia. correo-e: redy.risco.r@alum.udep.edu.pe

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons