ElasticSearch | Indexation de contenu Mixte : présentiel / à distance

DerniĂšre mise Ă  jour : 09/10/2024

BanniÚre visuelle de présentation de la formation

Pré-inscription

Valider la pré-inscription

Présentation

Devenu extrĂȘmement populaire depuis sa sortie en 2010, Elasticsearch est un moteur de recherche open source puissant permettant d'indexer et de rechercher des donnĂ©es.

 

Cette formation certifiante vous permettra d'apprendre à développer avec Elasticsearch.

Eligible au financement OPCO

 

En savoir plus sur les dispositifs de financement

Objectifs

  • DĂ©couvrir les enjeux et les concepts clĂ©s d'Elasticsearch dans la recherche en plein texte
  • Monter des indices et indexer des documents
  • MaĂźtriser les requĂȘtes DSL et les agrĂ©gations pour la recherche en plein texte
  • Appliquer les scripts et les boosts pour personnaliser les rĂ©sultats de recherche
  • Utiliser les fonctionnalitĂ©s avancĂ©es pour rĂ©pondre aux besoins courants : auto-complĂ©tion, gĂ©olocalisation
  • Bien choisir la relation des documents dans la production
  • Savoir administrer et configurer les clusters
  • Coupler Java Ă  Elasticsearch via l'API client

Programme

Concepts de base

  • Concept du moteur de recherche
  • Introduction Ă  Elasticsearch
  • Concepts basics d'Elasticsearch
  • Installation et configuration

 

Indexation de documents   

  • Vue gĂ©nĂ©rale de l'API REST
  • CRUD API : Index, Get, Exist, Delete, Update, Multi Get, Bulk
  • Le versionage des documents

 

Elasticsearch vs Lucene : les valeurs ajoutées

  • Index inversĂ©
  • Trace de transaction
  • Segment

 

Analyse de texte

  • Le besoin d'une analyse de texte
  • Anatomie d'un Analyzer
  • Analyze API
  • Configuration d'un Analyzer
  • Les Tokenizers (Parseurs en Token)
  • Filtre de Tokens
  • Filtre de Synonyme
  • ICU Tokenizers & FiltersSQL avec Spark

 

Mapping

  • Les fondamentaux du Mapping
  • Mapping API
  • Les diffĂ©rents attributs et types de champs

 

Recherche de documents

  • Recherche de documents

 

Spark – SQL dĂ©couverte

  • Les dataframes
  • Chargement de donnĂ©es avec un schĂ©ma
  • AgrĂ©gation
  • Jointure
  • SQL avec Spark

 

Spark – streaming, recherche avancĂ©e

  • AgrĂ©gation : Scope
  • AgrĂ©gation mĂ©trique
  • AgrĂ©gation bucket
  • Pertinence
  • ModĂšle d'espace vectoriel
  • TF/IDF
  • Booster la requĂȘte
  • Scoring personalisĂ©
  • Highlighting
  • Suggestion

 

Relation des documents

  • ProblĂ©matique
  • DĂ©normalisation
  • Nested Object :
    • Mapping
    • RequĂȘte, Filtre, AgrĂ©gations
  • Parent / Child :
    • Mapping
    • RequĂȘte, Filtre, AgrĂ©gations

 

 

Fonctionnalités avancées

  • Percolator
  • Geolocation

 

Vers la production

  • Configuration d'un cluster
  • ScalabilitĂ© et volumĂ©trie de donnĂ©es
  • Bonnes pratiques matĂ©rielles
  • Supervision

 

Java et Elasticsearch

  • RequĂȘte DSL
  • RequĂȘte full-text
  • RequĂȘte aux termes
  • RequĂȘte composĂ©e
  • BitSet, Filtre et Lucene
  • Pagination
  • Ordonnancement
  • Types de recherche
  • Warmer Api

Public visé

  • Ce cours est destinĂ© aux futurs dĂ©veloppeurs d'applications Big Data intĂ©grant Elasticsearch comme moteur de recherche.

Prérequis

  • Connaissances solides en administration systĂšme Unix/Linux.
  • Connaissances basiques en SGBD, JSON et REST.

Modalités pédagogiques

Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :

  • Formation en prĂ©sentiel
    • En groupe (inter-entreprises ou intra-entreprise)
    • En individuel (monitorat)
    • En journĂ©e ou en cours du soir (sur demande spĂ©cifique)
  • Formation en distanciel
    • Distanciel synchrone
    • Distanciel asynchrone

Moyens et supports pédagogiques

  • Apports des connaissances communes.
  • Mises en situation sur le thĂšme de la formation et des cas concrets.
  • MĂ©thodologie d'apprentissage attractive, interactive et participative.
  • Equilibre thĂ©orie / pratique : 60 % / 40 %.
  • Supports de cours fournis au format papier et/ou numĂ©rique.
  • Ressources documentaires en ligne et rĂ©fĂ©rences mises Ă  disposition par le formateur.
  • Pour les formations en prĂ©sentiel dans les locaux mis Ă  disposition, les apprenants sont accueillis dans une salle de cours Ă©quipĂ©e d'un rĂ©seau Wi-Fi, d'un tableau blanc ou paperboard. Un ordinateur avec les logiciels appropriĂ©s est mis Ă  disposition (le cas Ă©chĂ©ant).

Modalités d'évaluation et de suivi

En amont de la formation

  • Recueil des besoins des apprenants afin de disposer des informations essentielles au bon dĂ©roulĂ© de la formation (profil, niveau, attentes particuliĂšres...).
  • Auto-positionnement des apprenants afin de mesurer le niveau de dĂ©part.

 

Tout au long de la formation

  • Évaluation continue des acquis avec des questions orales, des exercices, des QCM, des cas pratiques ou mises en situation...

 

A la fin de la formation

  • Auto-positionnement des apprenants afin de mesurer l'acquisition des compĂ©tences.
  • Evaluation par le formateur des compĂ©tences acquises par les apprenants.
  • Questionnaire de satisfaction Ă  chaud afin de recueillir la satisfaction des apprenants Ă  l'issue de la formation.
  • Questionnaire de satisfaction Ă  froid afin d'Ă©valuer les apports ancrĂ©s de la formation et leurs mises en application au quotidien.

Accessibilité

Nos formations peuvent ĂȘtre adaptĂ©es Ă  certaines conditions de handicap. Nous contacter pour toute information et demande spĂ©cifique.

Accessibilité à nos formations

Si vous ĂȘtes en situation de handicap, contactez-nous avant le dĂ©but de votre formation pour que nous puissions vous orienter efficacement et vous accueillir dans les meilleures conditions.

Inscription possible jusqu'à 10 jours avant le démarrage de la formation

Prochaines Sessions

  • DĂ©solĂ©, cette formation n'est pas programmĂ©e pour le moment.

    Si vous ĂȘtes responsable formation, vous pouvez faire une requĂȘte pour l'organiser en INTRA dans votre entreprise.

Dans la mĂȘme catĂ©gorie