modes de connexionx entre Palantir Foundry et Power BI

  • modes de connexionx entre Palantir Foundry et Power BI

    Posté par Wissal sur 1 août 2024 à 10h49

    Bonjour à tous,
    J’ai mis en place un driver ODBC pour pouvoir me connecter à Palantir Foundry via Power BI.
    J’ai quelques questions sur les modes de connexion à utiliser, sachant qu’avant, mes sources de données c’était des fichiers Excel et CSV (à court terme) avec une petite volumétrie de données (donc la question ne se posait pas vu que c’est de l’import).

    0-Sur le long terme, les données seront hébergées sur Palantir Foundry, et on compte archiver jusqu’à 200 millions de lignes sur les rapports Power BI. Cela est-il faisable ?
    1-Quelle est la taille maximale (en millions de lignes) peut-on stocker en import?
    2-Quand faut-il opter pour le Direct Query ?
    3-Est-ce qu’il y a des limitations en terme de volumétrie à ne pas dépasser ?
    4-Quel mode de connexion pourrait impacter les performances des rapports ?
    5-Est-ce qu’il y a des limitations en terme de fonctionnalités quand on utilise le mode Direct Query (Par exemple, le DAX ou même Power Query) ?
    6-J’ai entendu dire qu’il faudrait une Gateway pour l’actualisation des rapports sur PowerBI services sachant que la source c’est du Cloud, et pour une source hébergée sur le cloud, on n’a pas besoin de Gateway à ma connaissance.

    Merci d’avance pour les retours 🙂

    ypicot a répondu Il y a 2 mois, 3 semaines 2 Membres · 1 Réponse
  • 1 Réponse
  • ypicot

    Membre
    8 août 2024 à 23h03

    Bonjour

    De multiples questions, je vais essayer de répondre à certaines d’entre elles.

    Tout dépend de la publication du rapport. Si je comprends bien, ce rapport sera publié via un PBI pro ou premium. La limite ne concerne pas réellement le nombre de lignes, mais la taille totale du rapport.

    Une licence pro autorise 1Go par espace de travail. En gros, la taille occupée dans le cloud correspond à la taille de ton fichier .pbix, tu peux donc te faire une idée à partir de là. Pour aller plus loin, voir les licences Premium par utilisateur ou par capacité.

    Tu peux opter pour du DirectQuery quand tu dépasses cette limite de taille, puisque seules les infos de connexion seront stockées dans ton pbix (et donc dans le cloud). Attention cependant : d’une manière générale, le DirectQuery est *beaucoup* plus lent que l’import, VertiPaq (le moteur interne de PBI) étant optimisé pour l’analyse de données. De plus, la source de données est solicitée à chaque modification de filtre par l’utilisateur (on peut presque dire : à chaque clic de l’utilisateur). Enfin, tu as des tas de fonctions DAX (EOMONTH, RELATEDTABLE, …) incompatibles avec DirectQuery quand tu les utilises pour créer une colonne ou des règles de sécurité au niveau des lignes (Row Level Security ou RLS).

    Hormis les points évoqués ci-dessus il n’y a pas à ma connaissance de réelle limite à la taille des données, si ce n’est… la patience de l’utilisateur. Un fichier de qques millions de lignes mais avec du DAX complexe, des tas de hiérarchies, du RLS, et tu exploses les temps de réponse.

    Je n’ai pas d’expérience concrète concernant les gateway, mais il me semble qu’on peut s’en passer uniquement si les données sont dans Azure, pas dans un autre cloud.

    Yvan

Connectez-vous pour répondre.