Retour aux projets
Data Engineering & Finance durable · 2026 · Asset Management

Scoring ESG & Gouvernance des données
extra-financières

Pour une société de gestion d'actifs gérant plus de 90 Mds €, mise en place d'une plateforme de données ESG : ingestion automatisée depuis 5 fournisseurs, 48 contrôles qualité, calcul de 28 KPI extra-financiers et scoring propriétaire sur 3 284 instruments. Conformité SFDR et EU Taxonomy.

Cas d'usage illustratif — Données fictives

L'ensemble des données présentées dans cette étude (instruments financiers, scores ESG, couvertures fournisseurs, KPI extra-financiers) sont entièrement fictives et ont été générées synthétiquement à des fins de démonstration méthodologique uniquement. Elles ne représentent aucun client réel, aucun instrument financier existant, ni aucune donnée issue d'un fournisseur ESG tiers. Le rapport PDF et les visualisations illustrent la démarche et les livrables d'un projet de ce type, non des résultats réels.

Extrait de l'univers — 20 instruments fictifs

Échantillon représentatif des 3 284 instruments de la base de démonstration (toutes valeurs générées synthétiquement).

ISINÉmetteurPaysTypeSecteurScore EScore SScore GScore ESGRatingMSCISust.CDPComplétude
FR7846291043 NordEnergy SA FR Action Énergie 71.2 68.4 74.1 71.5 A 97.3 %
DE9234567891 AlphaCapital AG DE Action Finance 58.3 63.7 79.2 67.8 A 96.1 %
US5678901232 DataTech Corp. US Action Technologie 88.1 85.6 90.3 88.3 AA 99.2 %
DE4532167893 EuroMech AG DE Action Industrie 49.7 52.3 55.8 52.8 BBB 91.4 %
US7890123454 BioPharm Inc. US Action Santé 81.4 79.2 83.6 81.6 AA 98.7 %
FR2345678905 EuroRetail SA FR Action Consommation 65.9 68.1 72.4 68.9 A 94.8 %
FR8901234566 EuroUtilities SA FR Action Utilities 62.3 58.7 65.1 62.1 A 97.1 %
GB3456789017 MetalGroup PLC GB Obligation Matériaux 34.2 38.6 41.3 38.4 BB 89.3 %
FR4567890128 PremierImmo SA FR Action Immobilier 57.8 61.2 63.4 61.0 A 92.6 %
FR5678901239 EuroTel SA FR Action Télécom 44.1 47.3 50.2 47.3 BBB 95.4 %
IT6789012340 AcierGroup SpA IT Obligation Matériaux 18.4 22.7 25.3 22.4 B 88.1 %
LU7890123451 NordEnergy ESG UCITS ETF LU ETF Énergie 70.1 67.8 72.3 70.1 A 99.9 %
US9012345672 QuantumTech Inc. US Action Technologie 91.3 87.6 93.2 91.0 AAA 99.8 %
JP0123456783 NordEnergy Co., Ltd. JP Obligation Énergie 52.7 55.1 58.4 55.7 BBB 90.2 %
CH1234567894 AlpineWater Holding AG CH Action Utilities 78.4 75.2 81.6 78.6 AA 97.9 %
ES2345678905 IberCal Energy SA ES Action Énergie 27.3 31.8 35.2 31.8 BB 91.7 %
DE3456789016 EuroFab GmbH DE Obligation Industrie 8.4 11.2 13.7 11.2 CCC 88.4 %
LU4567890127 AlphaCapital ESG Leaders SICAV LU Fonds Finance 74.6 71.3 77.8 74.7 AA 99.9 %
SE5678901238 NordMech AB SE Action Industrie 86.2 83.7 88.9 86.4 AA 98.3 %
BR6789012349 PetroRenew SA BR Action Énergie 15.3 19.7 22.1 19.2 B 89.6 %

* Toutes les valeurs sont synthétiques — ISIN, noms, scores et indicateurs de couverture sont fictifs. Le fichier complet (3 284 instruments, 25 colonnes) est disponible sur demande à titre d'exemple technique.

Univers ESG couvert
3 284
instruments financiers
Complétude données
96,1 %
vs 71,4 % avant projet
KPI calculés
28
par instrument · 3 piliers
Corrections manuelles
−62 %
grâce aux contrôles auto
Contexte & enjeu

Les données ESG : un actif stratégique encore mal maîtrisé

Un paysage de données fragmenté et hétérogène

Les sociétés de gestion d'actifs s'appuient sur une multitude de fournisseurs de données ESG (MSCI, Sustainalytics, CDP, Bloomberg…) dont les méthodologies, périmètres et fréquences de mise à jour divergent significativement. Cette hétérogénéité génère des incohérences qui fragilisent la qualité des scores publiés et exposent à des risques de greenwashing.

Des exigences réglementaires croissantes (SFDR, EU Taxonomy)

Le règlement SFDR (Sustainable Finance Disclosure Regulation) impose aux gestionnaires de fonds de documenter et justifier leurs scores ESG auprès des régulateurs. L'EU Taxonomy exige une traçabilité complète de la classification des activités durables. Ces obligations imposent un niveau de rigueur et de gouvernance des données inédit dans le secteur.

Un processus manuel chronophage et source d'erreurs

Sans infrastructure dédiée, les équipes data extra-financière passent 60 à 70 % de leur temps à des tâches de réconciliation manuelle, de correction d'anomalies et de mise à jour des tables de mapping. Ce temps n'est pas consacré à l'analyse et à la valeur ajoutée métier.

Périmètre du projet
5
fournisseurs de données intégrés (MSCI, Sustainalytics, CDP, Bloomberg, données internes)
48
règles de contrôle qualité automatisées
96,4 %
taux de réconciliation automatique inter-référentiels
SFDR
+ EU Taxonomy · conformité réglementaire intégrée dès la conception
Méthodologie

De l'ingestion brute au score ESG auditable

01

Audit de l'écosystème de données ESG existant

Cartographie exhaustive des sources de données extra-financières disponibles (fournisseurs tiers, données internes, reportings publics), des tables de mapping inter-référentiels et des flux d'alimentation. Identification des silos, des doublons, des ruptures de séries et des lacunes de couverture. Livrable : schéma des flux de données annoté avec les points de friction.

02

Automatisation de l'ingestion et détection des changements

Développement de connecteurs Python/SQL vers 5 sources de données externes (MSCI ESG, Sustainalytics, CDP, Bloomberg ESG, données internes). Mise en place d'une détection automatique des changements méthodologiques (révision de score, retraitement historique) et des évolutions de structure (nouveaux champs, renommages). Alertes différenciées selon la criticité du changement.

03

Framework de contrôle qualité des données

Implémentation de 48 règles de qualité couvrant la complétude (valeurs manquantes par champ et par instrument), la cohérence (détection d'anomalies inter-sources, bornes physiques, cohérence temporelle) et la fraîcheur (délai de mise à jour par source). Tableau de bord de monitoring en temps réel avec escalade automatique sur les dégradations significatives.

04

Calcul des KPI et scores ESG par instrument

Production de 28 KPI extra-financiers par instrument financier (émissions CO₂, intensité carbone, score de diversité, ratio d'indépendance du CA, controverses actives…). Agrégation multi-sources pondérée avec règles de priorisation documentées. Calcul du score ESG propriétaire sur les 3 piliers (E, S, G) selon une méthodologie alignée avec les standards SFDR et EU Taxonomy.

05

Tables de mapping et réconciliation inter-sources

Construction et maintenance des tables de correspondance entre les identifiants de chaque fournisseur (ISIN, LEI, Bloomberg ticker, SEDOL, Refinitiv RIC). Algorithme de fuzzy matching pour gérer les cas ambigus (fusions, restructurations, changements de nom). Taux de réconciliation automatique : 96,4 % sur l'univers cible.

06

Documentation, gouvernance et traçabilité

Rédaction du dictionnaire de données (définition, source, fréquence, responsable) pour l'ensemble des 28 KPI. Implémentation du data lineage : pour chaque valeur publiée, traçabilité complète jusqu'à la source brute avec horodatage. Procédures de validation manuelle pour les cas critiques. Documentation des modèles de score sous format Markdown versionné (Git).

Résultats clés

Avant / après — impact mesurable

3 284
instruments couverts dans l'univers ESG
actions, obligations, ETF, fonds
96,1 %
taux de complétude des données clés
vs 71,4 % avant projet (+24,7 pts)
28
KPI extra-financiers calculés par instrument
E, S, G + controverses + score synthétique
−62 %
de corrections manuelles nécessaires
grâce aux contrôles qualité automatisés

Taux de couverture par fournisseur de données

Chaque fournisseur couvre un périmètre différent de l'univers cible. La combinaison multi-sources permet d'atteindre 98,2 % de couverture globale, contre 61–94 % pour chaque source prise isolément. Les données internes (émissions déclarées, engagements RSE) couvrent 100 % mais avec une granularité limitée.

25 % 50 % 75 % 100 % MSCI ESG 94.2 % Sustainalytics 88.7 % CDP 61.3 % Bloomberg ESG 78.4 % Données internes 100 %

Amélioration des métriques qualité après implémentation

Les 48 contrôles automatisés ont permis d'améliorer significativement les 4 dimensions de qualité mesurées. La progression la plus nette concerne la fraîcheur des données (+33,6 pts) et la cohérence inter-sources (+28,6 pts), deux facteurs directement liés au scoring ESG.

Comparaison avant / après implémentation de la plateforme.

Avant Après 25 % 50 % 75 % 100 % Taux de complétude 71.4 % 96.1 % Cohérence inter-sources 63.2 % 91.8 % Fraîcheur (< 6 mois) 54.7 % 88.3 % Couverture univers cible 82.1 % 98.2 %

Distribution des scores ESG par pilier

La distribution des scores sur les 3 piliers (Environnement, Social, Gouvernance) révèle des profils distincts. La gouvernance est légèrement mieux notée en moyenne (plus d'entreprises notées AAA/AA), tandis que le pilier Environnement concentre davantage d'entités dans les déciles médians, reflet d'une transition en cours mais inégale.

E – Environ. S – Social G – Gouv. AAA AA A BBB BB B CCC
Architecture

Stack technique et flux de données

Ingestion & stockage — Snowflake + Python

Connecteurs Python vers les APIs et fichiers SFTP de chaque fournisseur. Chargement dans Snowflake via des tables raw versionnées (historique complet conservé). Orchestration des pipelines avec Apache Airflow : planification, retry, alertes.

Qualité & validation — Great Expectations + SQL

48 suites de tests Great Expectations couvrant complétude, cohérence et fraîcheur. Résultats publiés dans un data quality dashboard consultable par l'équipe métier. Escalade automatique par email sur les dégradations critiques (seuil configurable par KPI).

Transformation & scoring — dbt + Python

Modèles dbt pour les transformations SQL complexes (agrégation multi-sources, réconciliation ISIN/LEI, calcul des 28 KPI). Modèles de scoring Python en couche applicative, avec paramétrage des pondérations par pilier. Résultats exposés via vues Snowflake consommées par les équipes de gestion.

Gouvernance & traçabilité — Data lineage + Git

Data lineage complet : chaque valeur publiée est traçable jusqu'à sa source brute (fournisseur, date d'extraction, version de méthodologie). Dictionnaire de données versionné sous Git. Procédures documentées pour les 12 cas d'exception identifiés (retraitement historique, changement de périmètre, données conflictuelles).

Conformité réglementaire

SFDR et EU Taxonomy : la gouvernance comme pré-requis

Le règlement SFDR impose aux gérants de fonds de catégorie Article 8 et Article 9 de documenter leurs indicateurs PAI (Principal Adverse Impact) et de justifier leurs scores ESG avec une traçabilité complète. La plateforme répond à ces exigences en intégrant la conformité réglementaire dès la conception, et non comme une couche additionnelle.

PAI

18 indicateurs d'impact négatif principal calculés automatiquement

Lineage

Traçabilité source → KPI → score pour chaque valeur publiée

Audit

Historique complet conservé · reproductibilité à toute date

Valeur ajoutée

Ce que ce type de projet apporte

Scores ESG fiables et auditables

Remplacer les scores manuels fragiles par un pipeline automatisé, versionné et reproductible. Chaque score est justifiable devant un régulateur ou un client institutionnel.

Réduction du temps opérationnel

Les tâches manuelles de réconciliation et de correction, qui mobilisaient 60 % du temps des équipes data, sont automatisées. Les analystes se concentrent sur l'interprétation et la valeur ajoutée.

Conformité réglementaire intégrée

La traçabilité et la documentation répondent aux exigences SFDR et EU Taxonomy, réduisant le risque de non-conformité et les coûts d'audit.

Extensible à d'autres classes d'actifs

L'architecture modulaire (connecteurs, règles de qualité, modèles de scoring) s'étend facilement à de nouvelles sources ou de nouvelles classes d'actifs sans refonte.

"La donnée ESG n'est fiable que si sa chaîne de production est maîtrisée de bout en bout. Investir dans la gouvernance des données extra-financières, c'est investir dans la crédibilité de toute la démarche ISR."

Démarrer une mission

Prêt à transformer vos données en décisions ?

Décrivez votre besoin, et je vous réponds sous 48h avec une première analyse de votre problématique et une proposition adaptée.

Réponse sous 48h