Formation ElasticSearch
1490€ HT / personne |
2 jours (14 heures) |
Présentation
ElasticSearch est un moteur de recherche et d’indexation Open Source nouvelle génération. Sa nature distribuée et sa capacité à être résilient et hautement disponible ont déjà séduit des acteurs majeurs tels que Wikipedia, LinkedIn, Netflix, Ebay, ou WordPress.
ElasticSearch a été spécialement conçu pour indexer de très gros volumes de données tout en assurant une montée en charge performante et une forte tolérance aux pannes.
Cette formation aborde les concepts des moteurs de recherche avant de détailler les fonctionnalités de base d’Elasticsearch.
La formation apporte toutes les connaissances nécessaires pour utiliser et exploiter Elastic Search de façon efficace et résoudre les problématiques les plus souvent rencontrées.
Notre formation Elastic Search utilisera la dernière version stable en date du projet (Elasticsearch 8.15 à ce jour).
Objectifs
- Apprendre à utiliser Elasticsearch, de l’installation à son intégration en passant par sa configuration
- Utiliser le client et l’API Java d’Elasticsearch pour indexer et rechercher des documents
- Monitorer Elasticsearch et comprendre les statistiques d’utilisation
- Déterminer les enjeux et les cas d’usage d’un moteur de recherche
- Situer Elastic Search dans un environnement Big Data
- Comprendre le fonctionnement d’Elastic Search
- Savoir indexer d’importants volumes de données
- Comprendre l’administration et la surveillance du système pour garantir sa disponibilité
Public visé
- Architecte
- Développeur
- Chef de projet
- Big Data
Pré-requis
- Connaissances en Java & Linux
- Avoir idéalement suivi notre formation sur ElasticStack
- Tester Mes Connaissances
Programme de la formation ElasticSearch
Introduction aux moteurs de recherche
- Généralités
- Panorama des solutions de recherche Open Source
- Intégrer un moteur de recherche dans une application
- Enjeux et clés de succès
- Présentation des nouveautés de la version 6, 7 & 8
Introduction à Elasticsearch
- Historique du projet
- Apache Lucene
- Ce qu’apporte Elastisearch par rapport à Lucene
Les bases d’Elasticsearch
- Principes de fonctionnement en cluster
- Installation
- Configuration
- Notion de Node, d’Index et de Type
- Partitionnement de données
- Vue générale de l’API Rest
Observability chez Elastic
- Les piliers de l’observabilité
- Monitoring
- Logs
- Metrics
- Traces API
- Expédier des données depuis le serveur Elastic
- Données métriques d’expédition
- Données de journal d’expédition
- Surveillance de la performance des applications (APM)
- Applications d’observabilité
Indexation de documents
- Conception de l’index et de ses documents
- Indexer ou supprimer des documents avec l’API Rest
- Indexation en masse
- Version
- Pondération
- Autres fonctionnalités (routing, consistency, document enfant, …)
Mapping
- Définition et rôle du mapping
- Type de champs
- Les champs prédéfinis
- Méta données d’un Index
Analyse et extraction de texte
- Base de l’extraction et analyse de texte
- Analysers
- Char filters
- Tokenizers
- Token Filters
- Cas d’utilisation
- Configuration et utilisation des Analyzers prédéfinis ou customisés
- Analyse de texte en plusieurs langues
- Suppresion de mots
- Extraction d’adresses email et d’urls
- Suppression de balises HTML dans du texte
- Mise en place de la correction orthographique
- Indexation de fichiers binaires (utilisation d’Apache Tika)
Recherche de documents
- Rechercher des documents avec l’API Rest
- Gestion des résultats
- Types de requêtes
- Requête de type match_all
- Requête de type query_string/simple_query_string
- Requête de type match (et dérivées)
- Requête de type term et terms
- Requête de type wildcard
- Requête de type range
- Requête de type fuzzy
- Requête de type bool
- Requête de type exist/missing
- Requête de type and, or et not
- Requête de type type et id
- Différentier requêtes et filtres
- Types de filtres
- Combiner efficacement les filtres
- Pertinence
Fonctionnalités avancées de recherche
- Gestion de la pertinence et du score
- Suggestions
- Autocomplétion
- Highlighting
- Recherche Objets / Nested / Parent-Enfant
- More Like This
- Recherche géospatiale
Elasticsearch et API Java
- Types de clients disponibles
- Intégrer elasticsearch dans une application Java
- Embarqué
- Noeud client
- Transport client
- Utilisation de l’API Java
- Indexer et rechercher des documents
- Gérer les index
- Gérer les mappings
Cloud et Clusterisation
- Principe de fonctionnement d’un cluster elasticsearch
- Prévenir les split brains
- Configurer un cluster elasticsearch
- Scalabilité et volumétrie de données
- Sauvegarder et restaurer un cluster elasticsearch
- Supervision d’un cluster elasticsearch :
- l’API health
- l’API state
- l’API stats
- l’API pending_task
- l’API _nodes alias node info
- l’API hot_threads
- l’API _cat
- Plugins de supervision
- Logs
Fonctionnalités avancées
- Autres types de plugins elasticsearch
- River: définition
- Scripting
- Pré-chauffer son cluster
- La percolation
- Maintenance des nodes
- Répartition des indexes sur différents nodes
- Requêtes et statistiques
MODULE COMPLÉMENTAIRE EN ANGLAIS SUR DEMANDE (+2 JOURS)
- Training language: English
- Course level : Beginner to intermediate
Cette formation permet de maîtriser les concepts de base de Elasticsearch et d’explorer l’ensemble de ses fonctionnalité . Elle apporte les connaissances nécessaires pour pouvoir utiliser Elasticsearch d’une façon efficace en s’appuyant sur des cas d’utilisations réelles. Lors de cette formation, on aborde les bonnes pratiques ainsi que les problèmes souvent rencontrés.
Théorie : 60% Pratique : 40%
Audience :
- Software Developers
- Data Engineers
- Architects
Prerequisites :
- Knowledge of REST/HTTP, Json, Yaml are appreciated
- No knowledge required
Getting Started
- Elasticsearch Overview
- Keys Features
- Basic Concepts
- Install Elasticsearch
- CRUD Operations
- First steps on Search API
Mapping and Analysis
- Introduction
- Data Types
- Main parameters
- Mapping API
- Analysis and Inverted Index
- Custom Analyzer
- Multi-Fields
Querying
- Search API Overview
- Terms Search
- Full Text Search
- Compound Queries
Aggregations
- Aggregations Overview
- Metrics, Aggregations
- Buckets Aggregations
- Pipelines Aggregations
Modeling data
- Denormalization
- Object relationship
- Nested relationship
- Parent/Child relationship
Dynamic mapping and Templates
- Dynamic field mapping
- Dynamic template
- Template API
Nodes and Cluster Management
- Multi-nodes cluster
- Nodes Types
- Cluster settings
Ingest API
- Ingest Node
- Pipeline API
- Scripting
Overview
- Script API
- Painless language
More Features
- Alias
- Watcher
- Highlighting
- Suggestion
- Reindex Data
- Update by Query and Delete by Query
Module complémentaire : Préparation à la certification Elastic Engineer (+2 jours)
Pour aller plus loin
Formation Kibana
Formation Elasticsearch administration et infrastructure
Formation Elastic Stack ELK
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Le(s) Formateur(s)
Jean-Baptiste
Témoignages
Les + : Bonne progression de la difficulté, explications claires.
Afficher tous les témoignages
Les + : Bonne progression de la difficulté, explications claires.
Je recommande la formation
Les + : Communication du pédago
En synthèse : Bonne formation
Je recommande la formation
Je recommande la formation
Les + : Formateur très pédagogique, à l’écoute des besoins spécifiques, et très pragmatique.
Les – : RAS
En synthèse : RAS
Je recommande la formation
Je recommande la formation
Je recommande la formation
Les + : Très bon mélange théorie / pratique
Les + : Je n’avais aucune connaissance préalable en ElasticSearch, et cette formation m’a permis d’en apprendre les bases en adaptant le discours au niveau. Les explications d’Alexandre étaient claires, de bonnes analogies pour expliquer des concepts parfois assez complexes (indexation, sharding, etc)
Les – : J’aurais peut-être préféré un peu plus de temps alloué à la pratique, mais difficile de faire tenir ça dans une durée totale de deux jours.
Les + : Tour globale des différentes notions, vue d’ensemble intéressante
Les – : Durée, manque de pratique
Navigation Site Reviews
Noter la formation
1490€ HT / personne |
2 jours (14 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS