Optimisation modélisation

  • Optimisation modélisation

    Posté par Guillaume sur 27 février 2024 à 16h18

    Bonjour à tous,

    Je me pose une question sur la modélisation d’un de mes dataset PBi, j’ai une table de fait de vente de produit avec un champ FABRICANT_ID, un champ PRODUCTEUR_ID

    J’ai une table de dimension ACTEUR avec le champ Acteur_ID que je veux lier à la table de ventes, un acteur peut-etre Fabricant ou Producteur

    Comment lié ces deux tables, j’ai deux relations de 1 à plusieurs entre Acteur et Ventes, et donc je me demandais quelle est la meilleure modélisation dans ce genre de cas ?

    Merci

    Guillaume a répondu Il y a 7 mois, 3 semaines 3 Membres · 6 Réponses
  • 6 Réponses
  • David

    Membre
    27 février 2024 à 16h34

    Bonjour Guillaume

    Pourrais-tu nous montrer une capture écran de tes deux tables qui doivent être liées ?

  • Guillaume

    Membre
    27 février 2024 à 17h06

    En simplifiant c’est ça, assez classique.

    Je me demande si laissez la double relation comme ça se fait, ou alors faire un unpivot pour avoir un champ “type_actor” (manufacturer/producer) et “actor_id”

  • Philippe

    Membre
    28 février 2024 à 13h28

    Bonjour Guillaume,

    J’imagine que la meilleur modélisation est d’utiliser une table acteur qui reprend les propriétés communes aux fabicants et aux producteurs (nom, dépatement, pays etc.).

    Ensuite il est possible d’associer à cette table acteur la table fabricant et la table prodcuteurs (avec une relation disjointe) pour les propriétés spécifiques de chaque table.

    S’il n’y a pas de propriétés spéciques, alors la table acteur est la fusion des deux tables des fournisseurs et des producteurs.

    Bien à vous,

    PGeiger

  • Guillaume

    Membre
    29 février 2024 à 16h24

    Oui je parle d’un cas où il n’y aurait aucune spécificités entre fabricant et producteur.

    Donc potentiellement, on pourrait avoir une table fabricant et une producteur qui seraient exactement les mêmes ? Donc deux tables identiques dans notre modèle ?

    Imaginons je prends un autre exemple avec le même principe, un modèle de donnés sur les résultats du tennis professionnel. Une table avec les résultats de match qui contient notamment le champ Joueur_1 et le champ Joueur_2. Doit on avoir deux tables de dimensions Joueurs ? Ou une seule qui aurait deux liens avec la table de fait “Matchs” ?

  • Philippe

    Membre
    29 février 2024 à 16h32

    Guillaume,

    En première intention, je dirai un seule table et deux jointures. Cela impliquerai des mesures DAX pour gérer la relation inactive car il ne peux y avoir qu’une unique relation active.

    Maintenant, il existe d’autres modéles comme une jointure n-n entre le match et les journeurs : un match concernant plusieurs joueurs (ici 2). Mais ce modéle peut-être plus complexes à gérer.

    Bien à vous,

    PGeiger

  • Guillaume

    Membre
    29 février 2024 à 17h12

    D’accord merci.

    Oui voilà je me demandais ce qui était le plus optimisé en terme de modélisation et de calcul derrière entre deux relations sur la même tables avec une relation active et une inactive, ou alors avoir deux tables identiques.

Connectez-vous pour répondre.