En este artículo, aprenderas sobre el análisis de calidad de datos realizado por Detect. El artículo se divide en los siguientes apartados:
- ¿Qué es el análisis de calidad de datos en Detect?
- Motivos de descarte
- Errores y advertencias
- Data Quality en la UI
- Data Quality en los dashboards
¿Qué es el análisis de calidad de datos en Detect?
Para poder comparar edificios similares en Detect, es indispensable garantizar un nivel mínimo de calidad de los datos del edificio. Por eso se evalúan muchos parámetros y variables para cada edificio.
Supongamos que hay una configuración incorrecta, errores como la falta de datos relevantes o datos de consumo erróneos. En ese caso, un edificio se descartará y no generará resultados en Detect ni se utilizará para compararlo con otros edificios.
En cualquier otro escenario, el edificio será aceptado. Sin embargo, a pesar de no ser descartado, no implica una calidad perfecta de los datos. Por ello, se realiza un análisis más profundo para conocer el estado de calidad de los datos de cada edificio.
En los apartados siguientes se explica por qué puede descartarse un edificio y todas las categorías de calidad de datos que analiza el programa.
Motivos de descarte
When a building is discarded, it can be owing to reasons in two categories:
Cuando se descarta un edificio, puede deberse a razones de dos categorías:
- Problemas relacionados con la configuración de la cuenta o los datos de localización
- Problemas con los datos de consumo
Problemas relacionados con la configuración de la cuenta o los datos de la localización
Categoría | Error | Descripción |
Medidor de referencia | Sin medidor de referencia eléctrico | El medidor de referencia eléctrico no ha sido configurado para esa localización |
Coordenadas | Sin coordenadas | La localización se ha descartado en no poder obtener sus coordenadas |
Coordenadas incorrectas |
La localización se ha descartado porque el proveedor de geolocalización no ha podido obtener una dirección válida de las coordenadas configuradas. |
|
Actividades & Sectores | Sector no activo |
La localización se ha descartado si la cuenta tiene una lista pre-configurada de sectores activos y el sector de la localización no está incluido. |
Datos de Meteo | Sin datos de meteo. |
La localización se descarta si no es posible obtener datos de grados día ni de temperatura. |
Superficie |
Superficie original considerada incorrecta y no se puede estimar una nueva |
La superficie configurada es <10m2 y con los datos de consumo disponibles, Detect no es capaz de estimar una nueva superficie capaz de arrojar resultados de consumo específico razonables. |
Sin superficie |
La superficie configurada es <10m2 y con los datos de consumo disponibles, Detect no es capaz de estimar una de nueva. |
|
Consumo específico demasiado alto con huecos de datos |
El consumo específico es demasiado alto y faltan datos. |
|
Superficie estimada (solo si la superficie de la localización = 1m²) | Consumo específico demasiado bajo sin huecos de datos |
Aunque no falten datos, la localización se descarta porque después de imputar la superficie, el consumo específico es demasiado bajo. |
Consumo específico demasiado alto sin huecos de datos |
Aunque no falten datos, la localización se descarta porque después de imputar la superficie, el consumo específico es demasiado alto. |
|
Consumo específico proyectado demasiado bajo |
Después de imputar la superficie para esta localización y rellenar los huecos de datos, la localización se descarta porque el consumo específico es demasiado bajo. |
|
Consumo específico proyectado demasiado alto |
Después de imputar la superficie para esta localización y rellenar los huecos de datos, la localización se descarta porque el consumo específico es demasiado alto. |
Problemas con los datos de consumo
Categoría | Error | Descripción |
Carencia de datos | Sin lecturas |
La localización si no tiene lecturas de Energía Activa. |
Lagunas relevantes en los datos de consumo, faltan los datos de los primeros meses | Este error se produce si faltan datos en los meses iniciales del período de 12 meses. | |
Lagunas relevantes en los datos de consumo, faltan datos de meses intermedios |
Este error se produce si faltan datos en meses intermedios del período de 12 meses. |
|
Lagunas relevantes en los datos de consumo, faltan datos de los últimos meses |
Este error se produce si faltan datos en los últimos meses del período de 12 meses. |
|
Lagunas relevantes en los datos de consumo, faltan datos de algunos meses | Este error se produce si faltan datos distribuidos a lo largo del período de 12 meses. | |
Lagunas relevantes en los datos de consumo, no faltan datos de ningún mes |
Este error se produce si faltan datos pero no suman ningún mes completo. | |
Valores de consumo | Consumo inferior a un umbral definido |
Este error se produce si el consumo de 12 meses (teniendo en cuenta el consumo perdido estimado en huecos) es inferior a 1500 kWh |
Consumo inferior a un umbral definido, con lagunas de datos de los primeros meses | Este error se produce si el consumo de 12 meses es inferior a 1500 kWh porque faltan datos en los meses iniciales del periodo de 12 meses | |
Consumo inferior a un umbral definido, con lagunas de datos de meses intermedios | Este error se produce si el consumo de 12 meses es inferior a 1500 kWh porque faltan datos en meses intermedios del periodo de 12 meses | |
Consumo inferior a un umbral definido, con lagunas de datos de los últimos meses | Este error se produce si el consumo de 12 meses es inferior a 1500 kWh porque faltan datos en los meses finales del periodo de 12 meses | |
Consumo inferior a un umbral definido, con lagunas de datos en algunos meses |
Este error se produce si el consumo de 12 meses es inferior a 1500 kWh porque faltan datos en meses distribuidos del periodo de 12 meses | |
Consumo inferior a un umbral definido, no faltan datos de ningún mes |
Este error se produce si el consumo de 12 meses es inferior a 1500 kWh porque faltan datos, pero no falta un mes concreto |
Errores y advertencias
Los errores y las advertencias se analizan y distribuyen en las siguientes categorías:
-
Datos externos: Relacionados con datos meteorológicos y días festivos.
-
Metadatos: Relacionados con la configuración de la cuenta.
-
Superficie: Relacionados con los valores válidos para la superficie configurada.
-
Datos mensuales: Relacionados con lagunas de datos o valores extremos de consumo.
-
Datos horarios: Relacionados con lagunas de datos o valores extremos de consumo.
-
Geolocalización: Relacionado con coordenadas.
En este caso, para cada categoría, Detect analiza varios parámetros y luego clasifica todos los edificios aceptados en "sin advertencias", "con advertencias leves" o "con advertencias graves".
Data Quality en la UI
En la vista del portfolio dentro de Detect, hay tres secciones distintas relacionadas con la Data Quality:
- Resumen del estado del portfolio
- Estado detallado del portfolio
- Descripción de los errores y las advertencias
Resumen del estado del portfolio
La vista de resumen del estado de la cartera muestra un resumen del estado de la calidad de los datos de la cuenta, mediante un gráfico circular y barras apiladas.
El gráfico circular muestra en rojo el número de ubicaciones que se han descartado; y de las que se han aceptado, la distribución entre las que no tienen ninguna advertencia (en verde, 0 en la captura de pantalla inferior), las que tienen advertencias leves (en amarillo) y las que tienen advertencias graves (en naranja).
Las barras apiladas muestran la distribución de advertencias entre cada categoría analizada:
El número de ubicaciones descartadas es el mismo en todas las categorías, ya que se descartaron antes del análisis de advertencias y, por tanto, no pertenecen a ninguna categoría. Cada localización aparece una vez en cada categoría.
Estado detallado del portfolio
La sección de estado detallado de la cartera enlaza con una tabla que incluye todas las ubicaciones de la cuenta con todos los posibles motivos de descarte o análisis de advertencias:
Descripció de los errores y las advertencias
Esta sección muestra los conceptos analizados dentro de cada categoría para las ubicaciones aceptadas. Como ejemplo, la categoría de consumo horario:
Tomando como ejemplo la primera fila, "Consumo horario con valores válidos (sin ceros)":
- 57 ubicaciones de esta cuenta tienen un consumo horario válido sin ceros
- 4 tienen advertencias leves (tienen algunos ceros en su consumo)
- 2 tienen advertencias graves (tienen muchos ceros en su consumo)
Data Quality en los Dashboards
Para comprobar los widgets preparados sobre la calidad de datos de Detect, consulte este artículo.