ElasticSearch | Indexation de contenu Mixte : présentiel / à distance
Dernière mise à jour : 28/01/2025
Pré-inscription
Présentation
Devenu extrêmement populaire depuis sa sortie en 2010, Elasticsearch est un moteur de recherche open source puissant permettant d'indexer et de rechercher des données.
Â
Cette formation certifiante vous permettra d'apprendre à développer avec Elasticsearch.
Eligible au financement OPCO
- Actions Collectives OPCO Atlas
Cette formation peut être prise en charge à 100% dans le cadre des Actions Collectives.
Pour en bénéficier, contactez-nous à  hello.institute@docaposte.fr et complétez votre inscription sur campusAtlas.
Â
Objectifs
- Découvrir les enjeux et les concepts clés d'Elasticsearch dans la recherche en plein texte
- Monter des indices et indexer des documents
- Maîtriser les requêtes DSL et les agrégations pour la recherche en plein texte
- Appliquer les scripts et les boosts pour personnaliser les résultats de recherche
- Utiliser les fonctionnalités avancées pour répondre aux besoins courants : auto-complétion, géolocalisation
- Bien choisir la relation des documents dans la production
- Savoir administrer et configurer les clusters
- Coupler Java à Elasticsearch via l'API client
Public visé
- Ce cours est destiné aux futurs développeurs d'applications Big Data intégrant Elasticsearch comme moteur de recherche.
Prérequis
- Connaissances solides en administration système Unix/Linux.
- Connaissances basiques en SGBD, JSON et REST.
Programme

Concepts de base
- Concept du moteur de recherche
- Introduction à Elasticsearch
- Concepts basics d'Elasticsearch
- Installation et configuration
Â
Indexation de documents  Â
- Vue générale de l'API REST
- CRUD API : Index, Get, Exist, Delete, Update, Multi Get, Bulk
- Le versionage des documents
Â
Elasticsearch vs Lucene : les valeurs ajoutées
- Index inversé
- Trace de transaction
- Segment
Â
Analyse de texte
- Le besoin d'une analyse de texte
- Anatomie d'un Analyzer
- Analyze API
- Configuration d'un Analyzer
- Les Tokenizers (Parseurs en Token)
- Filtre de Tokens
- Filtre de Synonyme
- ICU Tokenizers & FiltersSQL avec Spark
Â
Mapping
- Les fondamentaux du Mapping
- Mapping API
- Les différents attributs et types de champs
Â
Recherche de documents
- Recherche de documents
Â
Spark – SQL découverte
- Les dataframes
- Chargement de données avec un schéma
- Agrégation
- Jointure
- SQL avec Spark
Â
Spark – streaming, recherche avancée
- Agrégation : Scope
- Agrégation métrique
- Agrégation bucket
- Pertinence
- Modèle d'espace vectoriel
- TF/IDF
- Booster la requête
- Scoring personalisé
- Highlighting
- Suggestion
Â
Relation des documents
- Problématique
- Dénormalisation
- Nested Object :
- Mapping
- Requête, Filtre, Agrégations
- Parent / Child :
- Mapping
- Requête, Filtre, Agrégations
Â
Â
Fonctionnalités avancées
- Percolator
- Geolocation
Â
Vers la production
- Configuration d'un cluster
- Scalabilité et volumétrie de données
- Bonnes pratiques matérielles
- Supervision
Â
Java et Elasticsearch
- Requête DSL
- Requête full-text
- Requête aux termes
- Requête composée
- BitSet, Filtre et Lucene
- Pagination
- Ordonnancement
- Types de recherche
- Warmer Api
Modalités pédagogiques
Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :
- Formation en présentiel
- En groupe (inter-entreprises ou intra-entreprise)
- En individuel (monitorat)
- En journée ou en cours du soir (sur demande spécifique)
- Formation en distanciel
- Distanciel synchrone
- Distanciel asynchrone
Moyens et supports pédagogiques
- Apports des connaissances communes.
- Mises en situation sur le thème de la formation et des cas concrets.
- Méthodologie d'apprentissage attractive, interactive et participative.
- Equilibre théorie / pratique : 60 % / 40 %.
- Supports de cours fournis au format papier et/ou numérique.
- Ressources documentaires en ligne et références mises à disposition par le formateur.
- Pour les formations en présentiel dans les locaux mis à disposition, les apprenants sont accueillis dans une salle de cours équipée d'un réseau Wi-Fi, d'un tableau blanc ou paperboard. Un ordinateur avec les logiciels appropriés est mis à disposition (le cas échéant).
Modalités d'évaluation et de suivi
En amont de la formation
- Recueil des besoins des apprenants afin de disposer des informations essentielles au bon déroulé de la formation (profil, niveau, attentes particulières...).
- Auto-positionnement des apprenants afin de mesurer le niveau de départ.
Â
Tout au long de la formation
- Évaluation continue des acquis avec des questions orales, des exercices, des QCM, des cas pratiques ou mises en situation...
Â
A la fin de la formation
- Auto-positionnement des apprenants afin de mesurer l'acquisition des compétences.
- Evaluation par le formateur des compétences acquises par les apprenants.
- Questionnaire de satisfaction à chaud afin de recueillir la satisfaction des apprenants à l'issue de la formation.
- Questionnaire de satisfaction à froid afin d'évaluer les apports ancrés de la formation et leurs mises en application au quotidien.
Â
NB : dans le cadre d'une Action collective, chaque stagiaire bénéficiaire sera contacté par un prestataire choisi par l'Opco Atlas afin d'évaluer « à chaud » la qualité de la formation suivie.Â
Â
Informations sur l'admission
Modalités d'admission
- Admission sans disposition particulière