Formation Natural Language Processing (NLP) et Text Mining
Objectif et modalités
Objectif : Durant cette formation les stagiaires découvrent les méthodes de la statistique textuelle. Ils découvrent les processus d’extraction de caractéristiques, de sélection et de classement dans des volumes importants de données textuelles. A l’issue de la formation, le participant connaît les principaux algorithmes de Machine Learning dédiés au traitement du langage naturel et sait évaluer les performances de chacun des algorithmes.
Durée : 3 jour (7h par jour) - Possibilité de distancer les journées dans le temps
Prix : 1200€ (Tarif HT par participant, soit 400€ HT / jour. Entreprises : contactez nous pour un devis personnalisé)
Prérequis : connaissances générales sur le Machine Learning ainsi qu'en statistiques
Un programme de formation complet
Les approches traditionnelles en Text Mining
-
La récupération et l'exploration du corpus de textes
-
Stemming, Lemmatization et suppression des mots de liaison
-
Tout rassembler pour nettoyer et normaliser les données
Feature Engineering pour la représentation de texte
-
Comprendre la syntaxe et la structure du texte
-
Le modèle Bag of Words et Bag of N-Grams
-
Le modèle TF-IDF, Transformer et Vectorizer
-
Le modèle Word2Vec et l’implémentation avec Gensim
La similarité des textes et classification non supervisée
-
Les concepts essentiels de similarité
-
Analyse de la similarité des termes : distances Hamming, Manhattan, Euclidienne et Levenshtein
-
Analyse de la similarité des documents
-
Les algorithmes de classification non supervisée
​​
La classification supervisée du texte
-
Prétraitement et normalisation des données
-
Modèles de classification, régression logistique, support Vector Machines, Random Forest, Gradient Boosting Machines
-
Évaluation des modèles de classification
​
Natural Language Processing et Deep Learning
-
Les librairies NLP : NLTK, TextBlob, SpaCy, Gensim, Pattern, Stanford CoreNLP
-
Les librairies Deep Learning : Theano, TensorFlow, Keras
-
RNN et Long Short-Term Memory. Les modèles bidirectionnels RNN
-
Les modèles Sequence-to-Sequence
Pourquoi nous choisir pour vous former ?
Nous sommes un centre agréé de formation, gage de la qualité de nos formations en Data Science et en Intelligence Artificielle, de notre équipe pédagogique et du suivi des stagiaires.
Nous avons une expérience de part notre activité de conseil dans la réalisation de projets de Data Science et d’Intelligence Artificielle offrant une excellente connaissance théorique mais aussi une très bonne vision sur l’application “réelle” en entreprise de l’Intelligence Artificielle et de la Data Science.
Nous proposons une approche très pragmatique avec des travaux pratiques adaptables aux données du client pour faciliter et accélérer la réalisation de projets internes.
​
Nous vous formons dans toute la France ou alors dans nos locaux à Lyon. Cette formation est également proposée en distanciel.
Prochaines dates
Voici les dates des prochaines sessions inter-entreprises :
​
-
Mercredi 15 septembre 2021 au vendredi 17 septembre 2021
​
-
Mercredi 13 octobre 2021 au vendredi 15 octobre 2021
​
-
Mercredi 17 novembre 2021 au vendredi 19 novembre 2021
​
-
Mercredi 8 décembre 2021 au vendredi 10 décembre 2021​
Vous êtes intéressés par la formation : contactez nous !
Par mail
Par téléphone