Qu'est-ce que la Business Intelligence ?
La Business Intelligence (BI) designe l'ensemble des processus, technologies et outils qui permettent de collecter, d'integrer, d'analyser et de presenter des informations business pour faciliter la prise de decision. Son objectif : transformer des donnees brutes en informations actionnables pour les dirigeants, les managers et les equipes operationnelles.
La BI englobe le reporting (tableaux de bord periodiques), l'analyse ad hoc (requetes ponctuelles sur les donnees), et de plus en plus l'analytique augmentee (suggestions automatiques, alertes et explications basees sur l'IA). Elle se distingue de la Data Science : la BI repond aux questions 'que s'est-il passe ?' et 'pourquoi ?' ; la Data Science repond a 'que va-t-il se passer ?' et 'que devrait-on faire ?'
Les quatre niveaux d'analytique
Descriptif (que s'est-il passe ?), Diagnostique (pourquoi cela s'est-il passe ?), Predictif (que va-t-il se passer ?) et Prescriptif (que devrait-on faire ?). La BI traditionnelle couvre surtout les deux premiers niveaux. Les outils BI modernes integrent de plus en plus des capacites predictives et prescriptives via des connecteurs ML.
La BI utilise principalement des donnees historiques structurees et produit des rapports pour des utilisateurs metier. La Data Science explore des donnees non structurees, construit des modeles predictifs et s'adresse principalement aux equipes techniques. En pratique, les deux disciplines convergent dans les plateformes modernes.
KPI : definition, construction et pieges
Un KPI (Key Performance Indicator) est une mesure quantifiable qui evalue l'efficacite d'une organisation, d'un processus ou d'un individu par rapport a un objectif defini. La notion cle est dans 'Key' : un KPI doit etre un indicateur crucial, pas simplement une metrique disponible.
Les criteres SMART pour un bon KPI
Un KPI efficace est : Specifique (mesure une chose precise), Mesurable (quantifiable avec des donnees fiables), Atteignable (realiste par rapport au contexte), Relevant (lie directement aux objectifs strategiques), et Borne dans le Temps (avec une periode de reference claire). Exemple : 'Augmenter le taux de retention client a 90 jours de 65% a 75% d'ici Q4 2026' est un KPI SMART. 'Ameliorer l'experience client' ne l'est pas.
KPI de retard vs KPI d'avance
Les KPI de retard (lagging indicators) mesurent des resultats passes : chiffre d'affaires, NPS, taux de churn. Ils confirment ce qui s'est passe mais ne permettent pas d'anticiper. Les KPI d'avance (leading indicators) mesurent des signaux predictifs : nombre de demos planifiees, taux d'activation des nouvelles fonctionnalites, temps moyen avant premiere valeur (TTV). Un tableau de bord equilibre combine les deux.
Les vanity metrics donnent l'impression de succes sans etre actionnables. 'Nombre de pages vues' ou 'Nombre d'inscrits' sont souvent des vanity metrics si elles ne sont pas correlees aux objectifs business reels. Toujours demander : 'Que fera-t-on differemment si ce KPI double ?'
Les outils BI du marche
Le marche des outils BI s'est segmente entre solutions enterprise legacy, nouvelles plateformes cloud-native et outils open-source modernes.
Microsoft Power BI
Power BI est le leader mondial du marche BI selon Gartner, particulierement dominant dans les organisations Microsoft (Azure, Office 365). Il offre une interface intuitive de construction de dashboards, un moteur analytique puissant (DAX pour les calculs avances), et une integration native avec Excel et SharePoint. Power BI Desktop est gratuit ; Power BI Service (cloud) necessite une licence Pro.
Tableau (Salesforce)
Tableau est reputee pour ses capacites de dataviz avancees et son interface de drag-and-drop qui permet a des non-developpeurs de creer des visualisations sophistiquees. Racheee par Salesforce en 2019, elle s'integre nativement dans l'ecosysteme CRM. Tableau est souvent prefere par les equipes analytique qui valorisent l'exploration visuelle.
Looker (Google)
Looker se distingue par son langage LookML qui definit une couche semantique centralisee : toutes les metriques et dimensions sont definies une fois et reutilisees dans tous les rapports. Rachete par Google en 2019, il s'integre dans Google Cloud et BigQuery. Looker est le choix privilegie des organisations data-driven qui veulent une source unique de verite pour leurs metriques.
Metabase et Apache Superset
Metabase est l'outil BI open-source le plus accessible : sans SQL, les utilisateurs metier peuvent construire des rapports via une interface intuitive. Apache Superset est l'alternative open-source plus puissante, adoptee par les grandes organisations (Airbnb, Lyft), avec un support SQL complet et des capacites de visualisation avancees.
Modelisation dimensionnelle : star schema et snowflake schema
La modelisation dimensionnelle est le fondement technique des Data Warehouses analytiques. Elle structure les donnees pour optimiser les requetes OLAP et faciliter la comprehension par les utilisateurs metier.
Le star schema (schema en etoile)
Le star schema place les tables de faits (qui contiennent les mesures : chiffre d'affaires, quantite, duree) au centre, entourees de tables de dimensions (qui contiennent les contextes : date, produit, client, region). Les jointures sont simples et directes, ce qui optimise les performances des requetes analytiques. Exemple : table de faits 'ventes' avec colonnes montant, quantite, et cles vers les dimensions date, produit, client.
Slowly Changing Dimensions (SCD)
Les Slowly Changing Dimensions gerent l'evolution des dimensions dans le temps. Type 1 : on ecrase l'ancienne valeur (simple, mais perd l'historique). Type 2 : on ajoute une nouvelle ligne avec dates de validite (conserve l'historique, mais multiplie les lignes). Type 3 : on ajoute une colonne 'valeur precedente' (compromis limité). Le SCD Type 2 est le plus utilise pour les analyses historiques.
Ralph Kimball a formalise la modelisation dimensionnelle dans 'The Data Warehouse Toolkit' (1996). Son approche bottom-up (partir des processus metier) s'oppose a celle de Bill Inmon (top-down, entreprise d'abord). Les deux methodologies coexistent aujourd'hui.
Kimball, R., Ross, M. - The Data Warehouse Toolkit, 1996La couche semantique : une source unique de verite pour les metriques
La couche semantique (semantic layer) est une couche d'abstraction entre les donnees brutes et les outils BI. Elle centralise les definitions des metriques business et les rend accessibles de facon coherente a tous les outils de reporting.
Sans couche semantique, chaque outil BI recalcule ses propres metriques : le taux de conversion dans Power BI peut differer de celui dans Looker si les definitions varient. La couche semantique impose une definition unique et partagee. dbt Semantic Layer, LookML (Looker) et Cube.js sont les solutions les plus populaires.
dbt Semantic Layer
dbt Semantic Layer (anciennement dbt Metrics) permet de definir des metriques directement dans le code dbt, en SQL pur. Ces metriques sont ensuite exposees via une API MetricFlow que n'importe quel outil BI compatible peut interroger. L'avantage : metriques versionnees dans Git, testees et documentees, accessibles depuis Tableau, Power BI, Superset et bien d'autres.
Consolider vos connaissances BI avec les flashcards
La BI combine concepts metier (KPI, metriques, reporting) et techniques (SQL, modelisation, outils). La repetition espacee est ideale pour ancrer durablement ces notions, souvent melangees en pratique.
Les concepts a maitriser absolument : difference KPI vs metrique, star schema vs snowflake schema, SCD Type 1/2/3, lagging vs leading KPI, DAX vs SQL vs LookML. Ce sont les questions les plus recurrentes en entretien BI et Data Analytics.
Questions frequentes sur la Business Intelligence et les KPI
Qu'est-ce que la Business Intelligence ?
La Business Intelligence est l'ensemble des processus, technologies et outils qui permettent de collecter, analyser et presenter des informations pour faciliter la prise de decision. Elle repond aux questions 'que s'est-il passe ?' (descriptif) et 'pourquoi ?' (diagnostique), et se distingue de la Data Science qui repond a 'que va-t-il se passer ?' et 'que devrait-on faire ?'.
Quelle est la difference entre un KPI et une metrique ?
Une metrique est toute mesure quantifiable (nombre de visites, duree moyenne de session, chiffre d'affaires). Un KPI est une metrique specifiquement choisie parce qu'elle est cruciale pour mesurer la performance par rapport a un objectif strategique. Tous les KPIs sont des metriques, mais toutes les metriques ne sont pas des KPIs.
Quel outil BI choisir : Power BI, Tableau ou Looker ?
Power BI est le choix naturel dans les ecosystemes Microsoft (Azure, Office 365), avec des licences accessibles. Tableau est prefere pour l'exploration visuelle avancee et la creation de dataviz sophistiquees sans SQL. Looker est optimal pour les organisations data-driven qui veulent une couche semantique centralisee (LookML) et une integration Google Cloud.
Qu'est-ce qu'un star schema ?
Un star schema est un modele de donnees analytique avec une table de faits centrale (qui contient les mesures : ventes, revenus, quantites) entouree de tables de dimensions (qui contiennent les contextes : date, produit, client, region). Il est appele 'etoile' car le schema ressemble a une etoile avec la table de faits au centre.
Qu'est-ce qu'une Slowly Changing Dimension (SCD) ?
Une Slowly Changing Dimension gere l'evolution dans le temps d'une dimension (ex: un client change de region). Le Type 1 ecrase l'ancienne valeur (perd l'historique). Le Type 2 ajoute une nouvelle ligne avec dates de debut et fin de validite (conserve l'historique complet). Le Type 2 est le plus utilise dans les analyses historiques.
Qu'est-ce que la couche semantique ?
La couche semantique est une couche d'abstraction entre les donnees brutes et les outils BI. Elle centralise les definitions des metriques pour garantir qu'elles sont calculees de la meme facon dans tous les outils. dbt Semantic Layer, LookML et Cube.js sont les solutions les plus populaires. Elle evite que le taux de conversion dans Power BI differe de celui dans Tableau.
Qu'est-ce que DAX dans Power BI ?
DAX (Data Analysis Expressions) est le langage de formules de Power BI pour les calculs avances. Il permet de creer des mesures calculees, des colonnes calculees et des tables, directement dans le modele de donnees. DAX est particulierement puissant pour les calculs temporels (year-over-year, running totals) et les filtrages contextuels complexes.
Article precedent : Data Governance - definition et mise en oeuvre