Enrichir un modèle de données avec des données ouvertes

Modifié par Aurelie Bertrand le 2024/05/23 11:47


Les données ouvertes sont des données issues généralement du secteur public (collectivités, établissements publics, etc) et mises à disposition gratuitement pour réutilisation.
Il est possible d'enrichir vos données avec ces données ouvertes en les combinant via une jointure ou une union associative.

Configuration

Pour utiliser l'enrichissement des données avec des données ouvertes, il faut tout d'abord déployer le Module de données ouvertes et configurer les paramètres serveur.

Déploiement du module de données ouvertes

Pour déployer le module de données ouvertes depuis Digdash Metadata Service. Pour cela :

  1. Lancez le Studio.
  2. Cliquez sur le bouton Gestionnaires Icone_gestionnaire dans la barre latérale de gauche.
  3. Dans la boite qui s'affiche, cliquez sur DigDash Metadata Service.
    Gestionnaires

    ➡ La boite DigDash Metadata Service s'affiche
  4. Sélectionnez le composant Module de données ouvertes et cliquez sur Installer maintenant.
    Module de données ouvertes
    Lorsque l'installation est terminée le message suivant s'affiche :
    Opération terminée
  5. Cliquez sur OK puis Fermer.

➡ Un nouveau rôle Digdash Open Data est créé. Celui-ci contient les modèles de données basés sur des données ouvertes disponibles.

Role Digdash Open data

Activation de la fonctionnalité

La fonctionnalité d'enrichissement des données doit être activée dans les paramètres serveur. Pour cela :

  1. Depuis la page d'accueil, allez dans Configuration -> Paramètres serveur -> Paramètres supplémentaires -> Intelligence artificielle.
    Le champ L'identifiant du rôle contenant les modèles de données ouvertes contient l'identifiant du rôle dédié aux modèles de données ouvertes Digdash Open Data.
  2. Cochez la case Activer la fonctionnalité de données ouvertes.

Il est également possible de détecter automatiquement si des données ouvertes compatibles avec vos données sont disponibles, à la création de votre modèle de données. Pour cela :

  1. Cochez la case Activer la fonctionnalité de données ouvertes à la création d'un modèle de données.
    Si des données ouvertes compatibles avec vos données sont disponibles, elles vous seront proposées lors de la création de votre modèle de données (après clic sur le bouton Terminer lors de la configuration du modèle de données dans le Studio).
  2. Cliquez sur Enregistrer.

Paramètres serveur

Utilisation des données ouvertes

Si vous avez sélectionné Activer la fonctionnalité des données ouvertes à la création d'un modèle de données, lorsque vous allez créer un nouveau modèle de données et cliquer sur le bouton Terminer, la fenêtre Enrichissez votre modèle avec des données ouvertes va s'afficher.
Elle propose les jeux de données détectés comme utilisables pour enrichir vos données.
Les jeux de données proposés contiennent au moins une colonne avec un match supérieur à 90% avec une colonne de votre modèle de données.

Données ouvertes compatibles

Pour enrichir vos données :

  1. Cliquez sur un jeu de données pour en voir les détails.
    Sélection données ouvertes
  2. Sélectionnez le type de jointure que vous souhaitez appliquer : Jointure ou Union associative. Consultez les pages Effectuer une jointure de données  et Effectuer une union de données pour plus d'informations sur les types de combinaison.
  3. Sélectionnez la colonne à utiliser comme jointure dans la liste déroulante. Une icône 1712224536704-554.png est ajoutée devant le nom de la colonne clé.
  4. Cochez les colonnes que vous souhaitez ajouter à votre modèle.
  5. Cliquez sur le bouton Joindre à mon modèle en bas à droite de la fenêtre.
    ➡ La ou les colonnes sélectionnée(s) sont ajoutées dans le modèle de données.
    Un nouveau modèle de données de type Jointure ou Union est créé.
    (Un transformateur de modèles de données est également ajoutée dans le rôle dédié aux données ouvertes à des fins d'optimisation des données ouvertes.)

Vous pouvez également enrichir un modèle de données existant :

  1. Depuis le panneau de gestion des modèles de données, cliquez-droit sur le modèle de données de votre choix.
  2. Dans le menu contextuel qui s'affiche, sélectionnez Enrichir avec des données ouvertes.
    Menu Enrichir
    ➡ La fenêtre Enrichissez votre modèle avec des données ouvertes s'affiche.
  3. Procédez ensuite de même que décrit ci-dessus.