ElasticSearch | Indexation de contenu Mixte : présentiel / à distance
Dernière mise à jour : 25/11/2025
Pré-inscription
Présentation
Devenu extrêmement populaire depuis sa sortie en 2010, Elasticsearch est un moteur de recherche open source puissant permettant d'indexer et de rechercher des données.
Cette formation certifiante vous permettra d'apprendre à développer avec Elasticsearch.
Eligible au financement OPCO
- Actions Collectives OPCO Atlas
Cette formation peut être prise en charge à 100% dans le cadre des Actions Collectives.
Pour en bénéficier, contactez-nous à hello.institute@docaposte.fr et complétez votre inscription sur campusAtlas.
Objectifs
- Découvrir les enjeux et les concepts clés d'Elasticsearch dans la recherche en plein texte
- Monter des indices et indexer des documents
- Maîtriser les requêtes DSL et les agrégations pour la recherche en plein texte
- Appliquer les scripts et les boosts pour personnaliser les résultats de recherche
- Utiliser les fonctionnalités avancées pour répondre aux besoins courants : auto-complétion, géolocalisation
- Bien choisir la relation des documents dans la production
- Savoir administrer et configurer les clusters
- Coupler Java à Elasticsearch via l'API client
Public visé
- Ce cours est destiné aux futurs développeurs d'applications Big Data intégrant Elasticsearch comme moteur de recherche.
Prérequis
- Connaissances solides en administration système Unix/Linux.
- Connaissances basiques en SGBD, JSON et REST.
Programme
Concepts de base
- Concept du moteur de recherche
- Introduction à Elasticsearch
- Concepts basics d'Elasticsearch
- Installation et configuration
Indexation de documents
- Vue générale de l'API REST
- CRUD API : Index, Get, Exist, Delete, Update, Multi Get, Bulk
- Le versionage des documents
Elasticsearch vs Lucene : les valeurs ajoutées
- Index inversé
- Trace de transaction
- Segment
Analyse de texte
- Le besoin d'une analyse de texte
- Anatomie d'un Analyzer
- Analyze API
- Configuration d'un Analyzer
- Les Tokenizers (Parseurs en Token)
- Filtre de Tokens
- Filtre de Synonyme
- ICU Tokenizers & FiltersSQL avec Spark
Mapping
- Les fondamentaux du Mapping
- Mapping API
- Les différents attributs et types de champs
Recherche de documents
- Recherche de documents
Spark – SQL découverte
- Les dataframes
- Chargement de données avec un schéma
- Agrégation
- Jointure
- SQL avec Spark
Spark – streaming, recherche avancée
- Agrégation : Scope
- Agrégation métrique
- Agrégation bucket
- Pertinence
- Modèle d'espace vectoriel
- TF/IDF
- Booster la requête
- Scoring personalisé
- Highlighting
- Suggestion
Relation des documents
- Problématique
- Dénormalisation
- Nested Object :
- Mapping
- Requête, Filtre, Agrégations
- Parent / Child :
- Mapping
- Requête, Filtre, Agrégations
Fonctionnalités avancées
- Percolator
- Geolocation
Vers la production
- Configuration d'un cluster
- Scalabilité et volumétrie de données
- Bonnes pratiques matérielles
- Supervision
Java et Elasticsearch
- Requête DSL
- Requête full-text
- Requête aux termes
- Requête composée
- BitSet, Filtre et Lucene
- Pagination
- Ordonnancement
- Types de recherche
- Warmer Api
Modalités pédagogiques
Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :
- Formation en présentiel
- En groupe (inter-entreprises ou intra-entreprise)
- En individuel (monitorat)
- En journée ou en cours du soir (sur demande spécifique)
- Formation en distanciel
- Distanciel synchrone
- Distanciel asynchrone
Moyens et supports pédagogiques
- Apports des connaissances communes.
- Mises en situation sur le thème de la formation et des cas concrets.
- Méthodologie d'apprentissage attractive, interactive et participative.
- Equilibre théorie / pratique : 60 % / 40 %.
- Supports de cours fournis au format papier et/ou numérique.
- Ressources documentaires en ligne et références mises à disposition par le formateur.
- Pour les formations en présentiel dans les locaux mis à disposition, les apprenants sont accueillis dans une salle de cours équipée d'un réseau Wi-Fi, d'un tableau blanc ou paperboard. Un ordinateur avec les logiciels appropriés est mis à disposition (le cas échéant).
Modalités d'évaluation et de suivi
En amont de la formation
- Recueil des besoins des apprenants afin de disposer des informations essentielles au bon déroulé de la formation (profil, niveau, attentes particulières...).
- Auto-positionnement des apprenants afin de mesurer le niveau de départ.
Tout au long de la formation
- Évaluation continue des acquis avec des questions orales, des exercices, des QCM, des cas pratiques ou mises en situation...
A la fin de la formation
- Auto-positionnement des apprenants afin de mesurer l'acquisition des compétences.
- Evaluation par le formateur des compétences acquises par les apprenants.
- Questionnaire de satisfaction à chaud afin de recueillir la satisfaction des apprenants à l'issue de la formation.
- Questionnaire de satisfaction à froid afin d'évaluer les apports ancrés de la formation et leurs mises en application au quotidien.
NB : dans le cadre d'une Action collective, chaque stagiaire bénéficiaire sera contacté par un prestataire choisi par l'Opco Atlas afin d'évaluer « à chaud » la qualité de la formation suivie.
Informations sur l'admission
Modalités d'admission
- Admission sans disposition particulière