Formation Moyens et solutions pratiques pour le Big Data Analysis Mixte : présentiel / à distance
DerniĂšre mise Ă jour : 27/01/2026
Pré-inscription
Présentation
Cette formation vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en Ćuvre. Vous apprendrez Ă intĂ©grer des volumĂ©tries massives de donnĂ©es structurĂ©es et non structurĂ©es via un ETL, puis Ă les analyser grĂące Ă des modĂšles statistiques et des dashboards dynamiques.
Objectifs
- Comprendre les concepts et l'apport du Big Data par rapport aux enjeux métiers
- Comprendre l'écosystÚme technologique nécessaire pour réaliser un projet Big Data
- Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs
- Implémenter des modÚles d'analyses statistiques pour répondre aux besoins métiers
- Appréhender un outil de data visualisation pour restituer des analyses dynamiques
Public visé
- Dataminers
- Chargés d'études statistiques
- Développeurs
- Chefs de projet
- Consultants en informatique décisionnelle
Prérequis
- Connaissances de base des modĂšles relationnels, des statistiques et des langages de programmation
- Connaissances de base des concepts de la Business Intelligence
PRE REQUIS TECHNIQUES
- Apache Hadoop : Une plateforme open source pour le stockage et le traitement distribué de grandes quantités de données.
- Apache Spark : Un Framework open source qui permet le traitement rapide des données en mémoire, idéal pour les analyses en temps réel.
- Elasticsearch : Un moteur de recherche et d'analyse de données distribué, conçu pour la recherche et l'analyse en temps réel.
- MongoDB : Une base de données NoSQL qui permet le stockage et le traitement de données non structurées pour des applications d'analyse en temps réel.
- Tableau : Un logiciel de visualisation de données puissant et convivial qui permet de créer des tableaux de bord interactifs et des analyses visuelles.
- Splunk : Une plateforme d'analyse des données en temps réel qui permet de collecter, indexer et analyser des données à partir de différentes sources.
- SAS : Un logiciel d'analyse avancée qui offre une large gamme d'outils pour l'exploration, la modélisation et la visualisation des données.
- R : Un langage de programmation open source populaire pour l'analyse statistique et la visualisation des données.
- Python : Un langage de programmation polyvalent avec de nombreuses bibliothÚques et packages pour l'analyse des données, tels que Pandas et NumPy.
- IBM Watson Analytics : Une plateforme d'analyse cognitive qui utilise l'intelligence artificielle pour analyser les données et fournir des insights.
- Â
Programme
Comprendre les concepts et les enjeux du Big Data
- Origines et définition du Big Data : la BI face à la croissance et à la diversité des données
- Les chiffres clés du marché dans le monde et en France
- Les enjeux du Big Data : ROI, organisation et confidentialité des données
- Un exemple d'architecture Big Data
Â
Les technologies du Big Data
- Description de l'architecture et des composants de la plateforme Hadoop
- Les modes de stockage (NoSQL, HDFS)
- Principes de fonctionnement de MapReduce
- Présentation des distributions principales du marché et des outils complémentaires (Hortonworks, Cloudera, MapR, Aster)
- Installer une plateforme Hadoop
- PrĂ©sentation des technologies spĂ©cifiques pour le Big Data (Talend, Tableau, Qlikview âŠ)
- Exercice : installation d'une plateforme Big Data complĂšte via Cloudera et ses composants.
Â
Les méthodes d'analyse des données pour le Big Data
- Les méthodes d'exploration
- Segmentation et classification
- Estimation et prédiction
- L'implémentation des modÚles
- Exercice : mise en place d'analyses avec le logiciel R
Â
Gérer les données structurées et non structurées
- Principes de fonctionnement de Hadoop Distributed File System (HDFS)
- Importer des données externes vers HDFS
- RĂ©aliser des requĂȘtes SQL avec HIVE
- Utiliser PIG pour traiter la donnée
- Utiliser un ETL pour industrialiser la création de flux de données massives
- Présentation de Talend For Big Data.
- Exercice : implémentation de flux de données massives
Â
Les méthodes d'analyse des données pour le Big Data
- Les outils de restitution du marché
- Méthodologie de mise en forme des rapports
- Apport du Big Data pour le « Social Business »
- Mesurer l'e-réputation et la notoriété d'une marque
- Mesurer l'expérience et la satisfaction clients, optimiser le parcours client
Modalités pédagogiques
Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :
Â
- Formation en présentiel
- En groupe (inter-entreprises ou intra-entreprise)
- En individuel (monitorat)
- En journée ou en cours du soir (sur demande spécifique)
- Formation en distanciel
- Distanciel synchrone
- Distanciel asynchrone
Â
Â
Moyens et supports pédagogiques
- Apports des connaissances communes.
- Mises en situation sur le thÚme de la formation et des cas concrets.
- Méthodologie d'apprentissage attractive, interactive et participative.
- Equilibre théorie / pratique : 60 % / 40 %.
- Supports de cours fournis au format papier et/ou numérique.
- Ressources documentaires en ligne et références mises à disposition par le formateur.
- Pour les formations en présentiel dans les locaux mis à disposition, les apprenants sont accueillis dans une salle de cours équipée d'un réseau Wi-Fi, d'un tableau blanc ou paperboard. Un ordinateur avec les logiciels appropriés est mis à disposition (le cas échéant).
Modalités d'évaluation et de suivi
En amont de la formation
Â
- Recueil des besoins des apprenants afin de disposer des informations essentielles au bon déroulé de la formation (profil, niveau, attentes particuliÚres...).
- Auto-positionnement des apprenants afin de mesurer le niveau de départ.
Tout au long de la formation
Â
- Ăvaluation continue des acquis avec des questions orales, des exercices, des QCM, des cas pratiques ou mises en situation...
A la fin de la formation
Â
- Auto-positionnement des apprenants afin de mesurer l'acquisition des compétences.
- Evaluation par le formateur des compétences acquises par les apprenants.
- Questionnaire de satisfaction à chaud afin de recueillir la satisfaction des apprenants à l'issue de la formation.
- Questionnaire de satisfaction à froid afin d'évaluer les apports ancrés de la formation et leurs mises en application au quotidien.
Informations sur l'admission
Nous consulter.
Modalités d'admission
- Admission sans disposition particuliĂšre
Accessibilité
Nos formations peuvent ĂȘtre adaptĂ©es Ă certaines conditions de handicap. Nous contacter pour toute information et demande spĂ©cifique.