Loading...
Please wait a moment
Founded by passionate advocates of learning and innovation, Learni set out to make professional training accessible to everyone, everywhere in the world. Our team works in the largest cities such as Paris, Lyon, Marseille, and internationally, to support talents and organizations in their skills development.
Which format do you prefer?
30 free minutes with a training advisor — no commitment.
Loading available slots...
Cybersecurity training in Oklahoma City in December 2026 with Learni. Certified, expert trainers, eligible for employer funding. Free quote.
Master influence and persuasion skills for 2026 with proven strategies, emerging tech, and practical exercises tailored for professional growth in a dynamic world.
Cybersecurity training in Sheffield in November 2026 with Learni. Certified, expert trainers, eligible for employer funding. Free quote.
Artificial Intelligence training in Mesa in September 2026 with Learni. Certified, expert trainers, eligible for employer funding. Free quote.
Don't let this gap widen
Sans maîtrise du data lineage, les entreprises perdent en moyenne 25% de temps en debugging lors d'incidents data, avec des coûts de non-qualité avoisinant 15% du budget IT selon Gartner.
68% des audits RGPD échouent faute de traçabilité, exposant à des amendes jusqu'à 4% du CA mondial.
Les data engineers sans ces compétences voient leur employabilité chuter de 40% en 2024, tandis que les concurrents optimisent leurs pipelines 2x plus vite.
Chaque trimestre sans formation creuse un gap critique en gouvernance data, risquant pertes de confiance clients et opportunités manquées.
The Formation Data Lineage - Maîtriser la traçabilité des données training is delivered in-person or remotely (blended-learning, e-learning, virtual classroom, remote in-person). At Learni, a Qualiopi-certified training organization, each program is designed to maximize skills acquisition, regardless of the training mode chosen.
The trainer alternates between demonstrative, interrogative, and active methods (through practical exercises and/or real-world scenarios). This pedagogical approach ensures concrete and directly applicable learning in the workplace.
To ensure the quality of the Formation Data Lineage - Maîtriser la traçabilité des données training, Learni provides the following teaching resources:
For in-house training at a location external to Learni, the client ensures and commits to having all necessary teaching materials (IT equipment, internet connection...) for the proper conduct of the training action in accordance with the prerequisites indicated in the communicated training program.
The assessment of skills acquired during the Formation Data Lineage - Maîtriser la traçabilité des données training is carried out through:
Learni is committed to the accessibility of its professional training programs. All our training programs are accessible to people with disabilities. Our teams are available to adapt teaching methods to your specific needs. Do not hesitate to contact us for any accommodation request.
Learni training programs are available for inter-company and intra-company settings, both in-person and remote. Registration is possible up to 48 business hours before the start of training. Our programs are eligible for OPCO, Pôle emploi, and FNE-Formation funding. Contact us to discuss your training project and funding possibilities.
Plongez dans les bases du data lineage en explorant sa définition, son rôle crucial dans la gouvernance des données et les risques sans traçabilité, installez un environnement de test avec Python et Pandas pour visualiser des flux simples, réalisez vos premiers exercices sur l'extraction de métadonnées de bases SQL, analysez des cas concrets d'entreprises touchées par des pertes de données non tracées, produisez une première cartographie manuelle de lineage qui servira de base au projet fil rouge.
Apprenez à modéliser les data lineages en identifiant sources, ETL et destinations, utilisez Mermaid et Draw.io pour créer des diagrammes interactifs de flux de données complexes, pratiquez sur des datasets réels issus de pipelines ETL comme Apache Airflow, intégrez les transformations SQL et Python dans votre cartographie, collaborez en binôme pour auditer un pipeline fictif d'entreprise, validez vos modèles avec des checks de cohérence et exportez-les en formats partageables pour une gouvernance data efficace.
Découvrez les outils open source phares comme OpenLineage et Marquez pour automatiser la capture de lineages, configurez des connecteurs avec dbt et Spark sur un cluster local, générez des traces automatiques lors d'exécutions ETL réelles, explorez l'interface web de Marquez pour query et visualiser les graphes de dépendances data, appliquez ces outils à votre projet fil rouge en instrumentant un pipeline simple, testez la résilience face à des changements de schéma et documentez les configurations pour un déploiement en production.
Intégrez le data lineage à la gouvernance d'entreprise en alignant sur RGPD et ISO 8000, réalisez des audits de conformité sur des flux sensibles avec masquage PII, mettez en place un monitoring basique via Prometheus et Grafana pour alerter sur les ruptures de lineage, analysez l'impact sur la qualité data via des métriques de fraîcheur et complétude, adaptez votre projet fil rouge à un scénario business réel comme un reporting financier, produisez un rapport d'audit avec recommandations actionnables pour les équipes data.
Finalisez votre projet fil rouge en déployant un pipeline complet avec data lineage automatisé sur Docker, intégrez-le à un workflow CI/CD via GitHub Actions pour une mise en prod sécurisée, simulez des scénarios d'incidents data pour tester la traçabilité, présentez votre solution devant le groupe avec démo live et Q&A, évaluez les performances scalables sur de gros volumes, recevez un feedback personnalisé du formateur expert et repartez avec un portfolio certifiant prêt pour votre CV professionnel.
Target audience
Data analysts, data engineers, responsables data governance et DSI souhaitant une montée en compétences sur la traçabilité des données
Prerequisites
Notions de base en SQL, bases de données relationnelles et gestion de fichiers de données
Loading...
Please wait a moment





























