Calcular una fórmula para el consumo de referencia de un proyecto de Medida y Verificación

Seguir

Introducción

En este artículo se describen las directrices básicas para el cálculo de la fórmula matemática que define el consumo de referencia o línea base (baseline) en nuestras instalaciones, revisando las variables disponibles, el período de referencia y cómo obtener la fórmula.      

Variables externas

En base a los datos que se puedan conseguir, el error de las regresiones será mayor o menor. Se debe tener presente el coste que puede conllevar la adquisición de algunos de los datos


A continuación se muestra una matriz de las variables externas que más influencia pueden tener sobre el consumo energético de forma genérica. Cada proyecto puede verse condicionado por otras variables. El usuario deberá identificarlas en base a la operación de la instalación y de su experiencia. 

 

dexma-baseline-01.png

 

Período de referencia

Se debe tener claro cuál es el período de tiempo en el que se produce un ciclo representativo de actividad en la instalación, para conocer cuál es el período mínimo de datos que se deberán recoger antes de calcular la fórmula. He aquí algunos ejemplos como referencia:

dexma-baseline-02.png

Preprocesamiento de datos

Una vez decididas las variables que pueden estar correlacionadas con el consumo energético, se deberán introducir en la plataforma, así como preparlas para trabajar con el software estadísico para el cálculo de la fórmula (Excel, Minitab, Stata, Matlab, etc.)

Se debe tener presente que las interacciones que haya entre diferentes variables o bien los cuadrados o cubos de las variables pueden ser representativos. Es aconsejable preparar series de datos adicionales con cálculos entre variables y potencias. 

Paralelamente, se deberán eliminar aquellos datos anómalos o singulares que no sean representativos de la instalación.

Obtener la fórmula matemática

La fórmula matemática es el resultado de un proceso estadístico de regresión lineal / no lineal multivariable. Cada uno de los programas informáticos realiza estros procedimientos de forma diversa, así que se deberán seguir sus propios tutoriales para conseguir la fórmula. 

Cada proyecto tiene su propia fórmula matemática y no existen fórmulas "estandard" para una tipología de instalación.

     
Obtener el "error" estadísitico

Todo proceso estadísitico conlleva un error de cálculo. El procedimiento que se haya seleccionado para el cálculo de la fórmula dará como resultado un coeficiente de correlación indicador de la cantidad de puntos explicados con dicha fórmula (o la variablidad que explica). Este indicador normalmente suele ser el indicador R^2.

Si por ejemplo se ha  conseguido un R^2 = 98%, esto indica que la fórmula explica un 98% del  consumo, así que se está cometiendo un error del 2%.

 

Calcular una fórmula  para el consumo de referencia usando la app Automatic Baseline Calculator

Ahora puedes calcular y evaluar fácilmente diferentes fórmulas para el consumo de referencia con la aplicación de market app "Automatic Baseline Calculator". Puedes encontrar más información sobre esta aplicación aquí.

Puedes instalar esta aplicación a través del market de aplicaciones.

 

Ejemplo paso a paso sobre cómo calcular de forma manual la fórmula del consumo de referencia (baseline) con Minitab

En este apartado se explica cómo calcular el consumo de referencia de una localización real en base a una serie de variables explicativas.     

La localización

Actividad: Estación de servicio, con cafetería, tienda y restaurante.
Ubicación: Barcelona

Datos necesarios

Tratándose de una estación de servicio, se podría discutir si el período representativo de actividad es una semana o un año. Probablemente el patrón de consumo se repita semanalmente así que con algunas semanas de datos sería suficiente. Por otro lado, si la estación tiene mucha estacionalidad climática, sería conveniente tener un año de datos.

Como datos de consumo, se debería disponer de, al menos, el consumo General de la instalación, a falta de submetering.

Como datos de contorno o variables explicativas del consumo, cuánta más información mejor. Sería ideal disponer de los grados día (CDD, HDD) y de algún parámetro indicativo de la ocupación de la estación de servicio (tíckets o ventas).

Datos disponibles

  • Variable Respuesta:
    • Consumo eléctrico General de toda la instalación desde Enero hasta Diciembre (1 año), en frecuencia horaria
  • Variables explicativas:
  • Interacciones entre variables
    • Siempre resulta interesante generar nuevas series de datos en base a transformaciones de las variables ya existentes y estudiar si correlacionan con el consumo. Para este ejemplo, se van a crear las potencias cuadradas y cúbicas de los grados día, potencias cuadradas de Tickets (T) y Ventas (S) y la multiplicación de Ventas * Grados día Calefacción y Ventas * Grados día refrigeración:
      • HDD^2, HDD^3
      • CDD^2, CDD^3
      • T^2, S^2
      • S*HDD, S*CDD

Resolución o frecuencia del baseline

La resolución o frecuencia del baseline se ve condicionada por la resolución de las variables disponibles. En este caso, los Grados día, tickets y ventas tienen resolución "diaria", así que ésta será la resolución de nuestra fórmula.

Calculando la fórmula con Minitab

Minitab es un software estadísitico muy útil para este tipo de trabajos.

Al acceder al software, inserta los datos en columnas, que previamente se habran trabajado en , como se muestra en la imagen:

dexma-baseline-03.png

Fe de erratas: En la imagen superior la columna de HDD^2 presenta los valores de HDD^3

La herramienta que se utilizará para el cálculo de la fórmula será la denominada "Regresión". Esta herramienta es optima en cuanto a la relación calidad-horas invertidas. Para análisis más profundos o donde sea necesaria una mejor precisión se puede utilizar la opción de "Regresión paso a paso".

Haz click en el menú de "Estadísticas" "Regresión""Regresión...":

dexma-baseline-04.png


 
Como Respuesta selecciona "General [kWh]" y como Predictores el resto de variables excepto la de "date", que es la fecha y no aporta valor. Las variables se seleccionan haciendo doble-click sobre ellas.  

dexma-baseline-05.png


Nota: Si se quiere observar los residuos en formato gráfico, en "Graficas" se puede activar la opción "cuatro en uno". Ver los residuos (error) en formato gráfico permitirá detectar valores anómalos que pueden ser eliminados del análisis.

Haciendo click en "Aceptar", Minitab calculará automáticamente la ecuación de consumo en base a todos los predictores seleccionados, el coeficiente de correlación (R-cuad) y se puede empezar el proceso de refinamiento. 

dexma-baseline-06.png

Refinando la ecuación - Valor del estadístico P

La primera ecuación calculada no tiene porqué ser la mejor. De hecho, se han introducido en el modelo una serie de interacciones entre variables y transformaciones que no tienen por qué correlacionar con el modelo. 

Una forma de entender si una variable correlaciona o no con nuestra respuesta es mirar el valor del Estadístico P. A modo orientativo, si es mayor que 0.05, se puede asumir que la variable no correlaciona en el modelo con la respuesta. En este modelo hay hasta 7 variables que al parecer no correlacionan:

dexma-baseline-07.png


La solución no consiste en eliminar todas las variables que no correlacionen, ya que entre ellas también puede haber afectaciones, si no ir quitando una a una, de mayor a menor valor de P e ir analizando en cada iteración qué valores de P se obtienen.

Además, puede suceder que una vez quitada una de las variables, si se vuelve a introducir una que ya estuviese "eliminada", se de un valor de P inferior a 0.05.

Por tanto, el proceso de refinamiento no tiene una duración concreta, ya que las combinaciones pueden ser infinitas. Se debe decidir cuándo el modelo es correcto para la finalidad y acabar las iteraciones. 

Uno de los posibles resultados podría ser este: 

dexma-baseline-08.png


Se puede ver como la ecuación se ha simplificado enormemente, utilizando únicamente como variables predictoras los grados día Refrigeración (CDD) y el número de ventas (S). Se puede ver como la fórmula es un polinomio no lineal de grado 3. Se tienen de la variable CDD elevada al cubo y la interacción de CDD con Ventas (S).

Esta fórmula es más sencilla de explicar al cliente y más fácil de obtener los datos, ya que únicamente se necesitan datos de CDD y Ventas (S), sin necesitar los Tickets (T). 

El valor de correlación es muy bueno, del 94.4%, lo que significa que el error en el cálculo en los ahorros será de 5.6%. 

 

Valores Anómalos

Con el gráfico de residuos se puede observar si hay valores anómalos en el modelo o no, hecho que provocará un menor coeficiente de correlación y un error mayor. De ser así, se puede llegar a un acuerdo con el cliente para eliminar estos datos del modelo.

Una vez calculada la fórmula ya se puede crear un proyecto de medida y verificación en la plataforma.

¿Te pareció útil este artículo?