La Qualité des Données chez Detect

S’abonner

Dans cet article, vous allez découvrir l'analyse de la qualité des données effectuée par Detect. L'article est divisé en sections suivantes :

Qu'est-ce que la Qualité des Données chez Detect ?

Detect est un produit qui analyse de vastes quantités de données, donc une mauvaise qualité des données peut devenir critique pour générer des résultats de bonne qualité. En conséquence, Detect évalue chaque bâtiment en détail pour maintenir un niveau minimum de qualité des données.

En cas de mauvaise configuration, ce qui peut entraîner des problèmes tels que des données pertinentes manquantes ou des données de consommation inexactes, le bâtiment sera rejeté et ne générera ni résultats dans Detect, ni ne sera utilisé pour la comparaison avec d'autres bâtiments.

Dans d'autres cas, le bâtiment sera accepté et générera des résultats dans Detect. Cependant, cette acceptation ne garantit pas une qualité des données parfaite. Par conséquent, une analyse plus détaillée est réalisée pour identifier d'éventuels avertissements légers ou sévères liés à la qualité des données.

Les sections suivantes expliqueront pourquoi un bâtiment pourrait être rejeté et détailleront les catégories de qualité des données analysées dans le logiciel.

 

Raisons de rejet

Lorsqu'un bâtiment est rejeté, cela peut être dû à des raisons appartenant à deux catégories :

Problèmes liés à la configuration du compte ou aux données de localisation

Groupe Qualité des Données Erreur Description
Compteurs de référence Sans dispositif de référence électrique Le dispositif de référence électrique n'a pas été configuré pour cet emplacement.
Coordinates Sans coordonnées L'emplacement est rejeté car il n'est pas possible de récupérer les coordonnées de l'emplacement.
Mauvaises coordonnées L'emplacement est rejeté car le fournisseur de géolocalisation ne peut pas obtenir une adresse valide à partir des coordonnées configurées.
Données météo Aucune donnée météorologique L'emplacement est rejeté s'il n'est pas possible de récupérer les degrés-jours et/ou les données de température.
Surface Surface incorrecte La surface configurée était <10m2 et avec les données de consommation disponibles, Detect n'a pas pu estimer une nouvelle surface qui donnerait des résultats de consommation spécifique raisonnables.
Sans surface La surface configurée était <10m2 et avec les données de consommation disponibles, Detect n'a pas pu estimer une surface.

 

Problèmes liés aux données de consommation

Catégorie Erreur Description
Trous de données Sans relevés Le lieu est rejeté s'il n'y a aucun relevé d'énergie active.
Lacunes de données de consommation pertinente, données des premiers mois manquantes Cette erreur est générée s'il manque des données dans les premiers mois de la période de 12 mois.
Lacunes de données de consommation pertinente, données des mois intermédiaires manquantes

Cette erreur est générée s'il manque des données dans les mois intermédiaires de la période de 12 mois.

Lacunes de données de consommation pertinente, données des derniers mois manquantes Cette erreur est générée s'il manque des données dans les derniers mois de la période de 12 mois.
Lacunes de données de consommation pertinente, données manquantes sur certains mois Cette erreur est générée s'il manque des données réparties sur la période de 12 mois.
Lacunes de données de consommation pertinente, aucune donnée manquante sur les mois Cette erreur est générée s'il manque des données mais qu'il n'y a pas de mois spécifiquement manquant.
Valeur de consommation Consommation inférieure à un seuil défini Cette erreur est générée si la consommation sur 12 mois (en tenant compte de la consommation estimée perdue dans les lacunes) est inférieure à 1500 kWh.
Consommation inférieure à un seuil défini, données des premiers mois manquantes Cette erreur est générée si la consommation sur 12 mois est inférieure à 1500 kWh en raison de données manquantes dans les premiers mois de la période de 12 mois.
Consommation inférieure à un seuil défini, données des mois intermédiaires manquantes Cette erreur est générée si la consommation sur 12 mois est inférieure à 1500 kWh en raison de données manquantes dans les mois intermédiaires de la période de 12 mois.
Consommation inférieure à un seuil défini, données des derniers mois manquantes Cette erreur est générée si la consommation sur 12 mois est inférieure à 1500 kWh en raison de données manquantes dans les derniers mois de la période de 12 mois.
Consommation inférieure à un seuil défini, données des mois distribués manquantes Cette erreur est générée si la consommation sur 12 mois est inférieure à 1500 kWh en raison de données manquantes sur des mois répartis sur la période de 12 mois.
Consommation inférieure à un seuil défini, aucune donnée manquante sur les mois Cette erreur est générée si la consommation sur 12 mois est inférieure à 1500 kWh en raison de données manquantes, mais sans mois spécifique manquant.

 

Erreurs et avertissements

Parmi les emplacements Acceptés, Detect recherche des avertissements de qualité des données légers et sévères dans les catégories suivantes :

  • Données externes : relatives aux données météorologiques et aux jours fériés.
  • Métadonnées : liées à la configuration du compte.
  • Surface : concernant les valeurs valides de la surface configurée.
  • Données mensuelles : liées aux lacunes de données ou aux valeurs de consommation extrêmes.
  • Données horaires : liées aux lacunes de données ou aux valeurs de consommation extrêmes.
  • Géolocalisation : concernant les coordonnées.

Pour chaque catégorie, Detect analyse plusieurs paramètres et classe tous les bâtiments acceptés en "sans avertissements", "avec avertissements légers" ou "avec avertissements sévères".

 

Qualité des Données dans l'interface utilisateur (UI)

Dans la vue de portefeuille au sein de Detect, il existe trois sections différentes liées à la Qualité des Données :

 

detect-data-quality-1.png

Résumé de l'état du portefeuille

La vue de résumé de l'état du portefeuille montre un récapitulatif de l'état de la qualité des données pour le compte, à travers un graphique circulaire et des barres empilées.

Le graphique circulaire montre le nombre de localisations rejetées en rouge ; parmi celles qui ont été acceptées, la répartition entre celles qui n'ont aucun avertissement (en vert), celles qui ont des avertissements légers (en jaune) et celles qui ont des avertissements sévères (en orange).

Les barres empilées montrent la répartition des avertissements dans chaque catégorie analysée.

detect-data-quality-2.png

Le nombre d'emplacements rejetés est le même dans chaque catégorie, car ils ont été rejetés avant l'analyse des avertissements et ne font donc partie d'aucune catégorie. Chaque emplacement apparaît une fois dans chaque catégorie.

 

État détaillé du portefeuille

La section d'état détaillé du portefeuille renvoie à un tableau qui répertorie toutes les localisations dans le compte avec toutes les raisons de rejet possibles ou l'analyse des avertissements.

detect-data-quality-3.png

 

Description des erreurs et avertissements

Cette section montre les concepts analysés à l'intérieur de chaque catégorie pour les localisations acceptées. Par exemple, pour la catégorie de consommation horaire :

detect-data-quality-4.png

En utilisant comme exemple la première ligne, "Consommation horaire avec des valeurs valides (sans zéros) :

  • 57 emplacements dans ce compte ont une consommation horaire valide sans zéros
  • 4 ont des avertissements légers (ont quelques zéros dans leur consommation)
  • 2 ont des avertissements sévères (beaucoup de zéros dans leur consommation).

 

Qualité des Données dans les Dashboards

Pour vérifier les widgets préparés pour la qualité des données Detect, veuillez consulter cet article.

Avez-vous trouvé cet article utile ?