Calidad de datos en Detect

Seguir

En este artículo, aprenderas sobre el análisis de calidad de datos realizado por Detect. El artículo se divide en los siguientes apartados:

¿Qué es el análisis de calidad de datos en Detect?

Para poder comparar edificios similares en Detect, es indispensable garantizar un nivel mínimo de calidad de los datos del edificio. Por eso se evalúan muchos parámetros y variables para cada edificio.

Supongamos que hay una configuración incorrecta, errores como la falta de datos relevantes o datos de consumo erróneos. En ese caso, un edificio se descartará y no generará resultados en Detect ni se utilizará para compararlo con otros edificios.

En cualquier otro escenario, el edificio será aceptado. Sin embargo, a pesar de no ser descartado, no implica una calidad perfecta de los datos. Por ello, se realiza un análisis más profundo para conocer el estado de calidad de los datos de cada edificio.

En los apartados siguientes se explica por qué puede descartarse un edificio y todas las categorías de calidad de datos que analiza el programa.

 

Motivos de descarte

When a building is discarded, it can be owing to reasons in two categories:

Cuando se descarta un edificio, puede deberse a razones de dos categorías:

Problemas relacionados con la configuración de la cuenta o los datos de la localización

Categoría Error Descripción
Medidor de referencia Sin medidor de referencia eléctrico El medidor de referencia eléctrico no ha sido configurado para esa localización
Coordenadas Sin coordenadas La localización se ha descartado en no poder obtener sus coordenadas
Coordenadas incorrectas

La localización se ha descartado porque el proveedor de geolocalización no ha podido obtener una dirección válida de las coordenadas configuradas.

Actividades & Sectores Sector no activo

La localización se ha descartado si la cuenta tiene una lista pre-configurada de sectores activos y el sector de la localización no está incluido.

Datos de Meteo Sin datos de meteo.

La localización se descarta si no es posible obtener datos de grados día ni de temperatura.

Superficie

Superficie original considerada incorrecta y no se puede estimar una nueva

La superficie configurada es <10m2 y con los datos de consumo disponibles, Detect no es capaz de estimar una nueva superficie capaz de arrojar resultados de consumo específico razonables.

Sin superficie

La superficie configurada es <10m2 y con los datos de consumo disponibles, Detect no es capaz de estimar una de nueva. 

 

Problemas con los datos de consumo

Categoría Error Descripción
Carencia de datos Sin lecturas

La localización si no tiene lecturas de Energía Activa.

Lagunas relevantes en los datos de consumo, faltan los datos de los primeros meses Este error se produce si faltan datos en los meses iniciales del período de 12 meses.
Lagunas relevantes en los datos de consumo, faltan datos de meses intermedios

Este error se produce si faltan datos en meses intermedios del período de 12 meses.

Lagunas relevantes en los datos de consumo, faltan datos de los últimos meses

Este error se produce si faltan datos en los últimos meses del período de 12 meses.

Lagunas relevantes en los datos de consumo, faltan datos de algunos meses Este error se produce si faltan datos distribuidos a lo largo del período de 12 meses.

Lagunas relevantes en los datos de consumo, no faltan datos de ningún mes

Este error se produce si faltan datos pero no suman ningún mes completo.
Valores de consumo Consumo inferior a un umbral definido

Este error se produce si el consumo de 12 meses (teniendo en cuenta el consumo perdido estimado en huecos) es inferior a 1500 kWh

Consumo inferior a un umbral definido, con lagunas de datos de los primeros meses Este error se produce si el consumo de 12 meses es inferior a 1500 kWh porque faltan datos en los meses iniciales del periodo de 12 meses
Consumo inferior a un umbral definido, con lagunas de datos de meses intermedios Este error se produce si el consumo de 12 meses es inferior a 1500 kWh porque faltan datos en meses intermedios del periodo de 12 meses
Consumo inferior a un umbral definido, con lagunas de datos de los últimos meses Este error se produce si el consumo de 12 meses es inferior a 1500 kWh porque faltan datos en los meses finales del periodo de 12 meses

Consumo inferior a un umbral definido, con lagunas de datos en algunos meses

Este error se produce si el consumo de 12 meses es inferior a 1500 kWh porque faltan datos en meses distribuidos del periodo de 12 meses

Consumo inferior a un umbral definido, no faltan datos de ningún mes

Este error se produce si el consumo de 12 meses es inferior a 1500 kWh porque faltan datos, pero no falta un mes concreto

 

Errores y advertencias

Los errores y las advertencias se analizan y distribuyen en las siguientes categorías: 

  • Datos externos: Relacionados con datos meteorológicos y días festivos.

  • Metadatos: Relacionados con la configuración de la cuenta.

  • Superficie: Relacionados con los valores válidos para la superficie configurada.

  • Datos mensuales: Relacionados con lagunas de datos o valores extremos de consumo.

  • Datos horarios: Relacionados con lagunas de datos o valores extremos de consumo.

  • Geolocalización: Relacionado con coordenadas.

En este caso, para cada categoría, Detect analiza varios parámetros y luego clasifica todos los edificios aceptados en "sin advertencias", "con advertencias leves" o "con advertencias graves".

 

Data Quality en la UI

En la vista del portfolio dentro de Detect, hay tres secciones distintas relacionadas con la Data Quality: 

 

detect-data-quality-1.png

Resumen del estado del portfolio

La vista de resumen del estado de la cartera muestra un resumen del estado de la calidad de los datos de la cuenta, mediante un gráfico circular y barras apiladas.

El gráfico circular muestra en rojo el número de ubicaciones que se han descartado; y de las que se han aceptado, la distribución entre las que no tienen ninguna advertencia (en verde, 0 en la captura de pantalla inferior), las que tienen advertencias leves (en amarillo) y las que tienen advertencias graves (en naranja).

Las barras apiladas muestran la distribución de advertencias entre cada categoría analizada:

detect-data-quality-2.png

El número de ubicaciones descartadas es el mismo en todas las categorías, ya que se descartaron antes del análisis de advertencias y, por tanto, no pertenecen a ninguna categoría. Cada localización aparece una vez en cada categoría.

 

Estado detallado del portfolio

La sección de estado detallado de la cartera enlaza con una tabla que incluye todas las ubicaciones de la cuenta con todos los posibles motivos de descarte o análisis de advertencias:

detect-data-quality-3.png

 

Descripció de los errores y las advertencias

Esta sección muestra los conceptos analizados dentro de cada categoría para las ubicaciones aceptadas. Como ejemplo, la categoría de consumo horario:

detect-data-quality-4.png

Tomando como ejemplo la primera fila, "Consumo horario con valores válidos (sin ceros)":

  • 57 ubicaciones de esta cuenta tienen un consumo horario válido sin ceros
  • 4 tienen advertencias leves (tienen algunos ceros en su consumo)
  • 2 tienen advertencias graves (tienen muchos ceros en su consumo)

 

Data Quality en los Dashboards

Para comprobar los widgets preparados sobre la calidad de datos de Detect, consulte este artículo.

¿Te pareció útil este artículo?