Formation Moyens et solutions pratiques pour le Big Data Analysis Mixte : présentiel / à distance

DerniĂšre mise Ă  jour : 27/01/2026

Pré-inscription

Ajouter au panier

Présentation

Cette formation vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en Ɠuvre. Vous apprendrez Ă  intĂ©grer des volumĂ©tries massives de donnĂ©es structurĂ©es et non structurĂ©es via un ETL, puis Ă  les analyser grĂące Ă  des modĂšles statistiques et des dashboards dynamiques.

Objectifs

  • Comprendre les concepts et l'apport du Big Data par rapport aux enjeux mĂ©tiers
  • Comprendre l'Ă©cosystĂšme technologique nĂ©cessaire pour rĂ©aliser un projet Big Data
  • AcquĂ©rir les compĂ©tences techniques pour gĂ©rer des flux de donnĂ©es complexes, non structurĂ©s et massifs
  • ImplĂ©menter des modĂšles d'analyses statistiques pour rĂ©pondre aux besoins mĂ©tiers
  • ApprĂ©hender un outil de data visualisation pour restituer des analyses dynamiques

Public visé

  • Dataminers
  • ChargĂ©s d'Ă©tudes statistiques
  • DĂ©veloppeurs
  • Chefs de projet
  • Consultants en informatique dĂ©cisionnelle

Prérequis

  • Connaissances de base des modĂšles relationnels, des statistiques et des langages de programmation
  • Connaissances de base des concepts de la Business Intelligence

PRE REQUIS TECHNIQUES

  • Apache Hadoop : Une plateforme open source pour le stockage et le traitement distribuĂ© de grandes quantitĂ©s de donnĂ©es.
  • Apache Spark : Un Framework open source qui permet le traitement rapide des donnĂ©es en mĂ©moire, idĂ©al pour les analyses en temps rĂ©el.
  • Elasticsearch : Un moteur de recherche et d'analyse de donnĂ©es distribuĂ©, conçu pour la recherche et l'analyse en temps rĂ©el.
  • MongoDB : Une base de donnĂ©es NoSQL qui permet le stockage et le traitement de donnĂ©es non structurĂ©es pour des applications d'analyse en temps rĂ©el.
  • Tableau : Un logiciel de visualisation de donnĂ©es puissant et convivial qui permet de crĂ©er des tableaux de bord interactifs et des analyses visuelles.
  • Splunk : Une plateforme d'analyse des donnĂ©es en temps rĂ©el qui permet de collecter, indexer et analyser des donnĂ©es Ă  partir de diffĂ©rentes sources.
  • SAS : Un logiciel d'analyse avancĂ©e qui offre une large gamme d'outils pour l'exploration, la modĂ©lisation et la visualisation des donnĂ©es.
  • R : Un langage de programmation open source populaire pour l'analyse statistique et la visualisation des donnĂ©es.
  • Python : Un langage de programmation polyvalent avec de nombreuses bibliothĂšques et packages pour l'analyse des donnĂ©es, tels que Pandas et NumPy.
  • IBM Watson Analytics : Une plateforme d'analyse cognitive qui utilise l'intelligence artificielle pour analyser les donnĂ©es et fournir des insights.
  •  

Programme

Comprendre les concepts et les enjeux du Big Data

  • Origines et dĂ©finition du Big Data : la BI face Ă  la croissance et Ă  la diversitĂ© des donnĂ©es
  • Les chiffres clĂ©s du marchĂ© dans le monde et en France
  • Les enjeux du Big Data : ROI, organisation et confidentialitĂ© des donnĂ©es
  • Un exemple d'architecture Big Data

 

Les technologies du Big Data

  • Description de l'architecture et des composants de la plateforme Hadoop
  • Les modes de stockage (NoSQL, HDFS)
  • Principes de fonctionnement de MapReduce
  • PrĂ©sentation des distributions principales du marchĂ© et des outils complĂ©mentaires (Hortonworks, Cloudera, MapR, Aster)
  • Installer une plateforme Hadoop
  • PrĂ©sentation des technologies spĂ©cifiques pour le Big Data (Talend, Tableau, Qlikview 
)
  • Exercice : installation d'une plateforme Big Data complĂšte via Cloudera et ses composants.

 

Les méthodes d'analyse des données pour le Big Data

  • Les mĂ©thodes d'exploration
  • Segmentation et classification
  • Estimation et prĂ©diction
  • L'implĂ©mentation des modĂšles
  • Exercice : mise en place d'analyses avec le logiciel R

 

Gérer les données structurées et non structurées

  • Principes de fonctionnement de Hadoop Distributed File System (HDFS)
  • Importer des donnĂ©es externes vers HDFS
  • RĂ©aliser des requĂȘtes SQL avec HIVE
  • Utiliser PIG pour traiter la donnĂ©e
  • Utiliser un ETL pour industrialiser la crĂ©ation de flux de donnĂ©es massives
  • PrĂ©sentation de Talend For Big Data.
  • Exercice : implĂ©mentation de flux de donnĂ©es massives

 

Les méthodes d'analyse des données pour le Big Data

  • Les outils de restitution du marchĂ©
  • MĂ©thodologie de mise en forme des rapports
  • Apport du Big Data pour le « Social Business »
  • Mesurer l'e-rĂ©putation et la notoriĂ©tĂ© d'une marque
  • Mesurer l'expĂ©rience et la satisfaction clients, optimiser le parcours client

Modalités pédagogiques

Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :

 

  • Formation en prĂ©sentiel
    • En groupe (inter-entreprises ou intra-entreprise)
    • En individuel (monitorat)
    • En journĂ©e ou en cours du soir (sur demande spĂ©cifique)
  • Formation en distanciel
    • Distanciel synchrone
    • Distanciel asynchrone

 

 

Moyens et supports pédagogiques

  • Apports des connaissances communes.
  • Mises en situation sur le thĂšme de la formation et des cas concrets.
  • MĂ©thodologie d'apprentissage attractive, interactive et participative.
  • Equilibre thĂ©orie / pratique : 60 % / 40 %.
  • Supports de cours fournis au format papier et/ou numĂ©rique.
  • Ressources documentaires en ligne et rĂ©fĂ©rences mises Ă  disposition par le formateur.
  • Pour les formations en prĂ©sentiel dans les locaux mis à disposition, les apprenants sont accueillis dans une salle de cours Ă©quipĂ©e d'un rĂ©seau Wi-Fi, d'un tableau blanc ou paperboard. Un ordinateur avec les logiciels appropriĂ©s est mis Ă  disposition (le cas Ă©chĂ©ant).

Modalités d'évaluation et de suivi

En amont de la formation

 

  • Recueil des besoins des apprenants afin de disposer des informations essentielles au bon dĂ©roulĂ© de la formation (profil, niveau, attentes particuliĂšres...).
  • Auto-positionnement des apprenants afin de mesurer le niveau de dĂ©part.

Tout au long de la formation

 

  • Évaluation continue des acquis avec des questions orales, des exercices, des QCM, des cas pratiques ou mises en situation...

A la fin de la formation

 

  • Auto-positionnement des apprenants afin de mesurer l'acquisition des compĂ©tences.
  • Evaluation par le formateur des compĂ©tences acquises par les apprenants.
  • Questionnaire de satisfaction Ă  chaud afin de recueillir la satisfaction des apprenants à l'issue de la formation.
  • Questionnaire de satisfaction Ă  froid afin d'Ă©valuer les apports ancrĂ©s de la formation et leurs mises en application au quotidien.

Informations sur l'admission

Nous consulter.

Modalités d'admission

  • Admission sans disposition particuliĂšre

Accessibilité

Nos formations peuvent ĂȘtre adaptĂ©es Ă  certaines conditions de handicap. Nous contacter pour toute information et demande spĂ©cifique.

Accessibilité à nos formations

Si vous ĂȘtes en situation de handicap, contactez-nous avant le dĂ©but de votre formation pour que nous puissions vous orienter efficacement et vous accueillir dans les meilleures conditions.

Inscription possible jusqu'à 10 jours avant le démarrage de la formation

Prochaines Sessions

  • Cette formation n'est pas programmĂ©e pour le moment.

    Contactez-nous pour planifier une session ensemble !