Data Mining
Présentiel
Format de la formation
Il n'y a pas encore de taux de satisfaction sur ce produit.
Formation
Durée
28 heures sur 4 jours
Groupe
De 3 à 8 personnes
Tarifs
Inter : Nous consulter
Intra : Nous consulter
Programme
Pré-requis
Connaissances de base en analyse décisionnelle. Connaissances de base en statistiques
Public concerné
Responsables Infocentre, responsables marketing, statisticiens, responsables informatiques, chefs de projets et experts décisionnels. Utilisateurs et gestionnaires métiers de bases de données.
Objectifs pédagogiques
- Comprendre le Data Mining
- Mettre en place d’une solution de Datamining
- Connaitre les techniques du Data Mining
- Intégrer une méthodologie
Contenu
1/ Comprendre le Data Mining
- Définition et finalité du Data Mining (DM). A quoi sert le DM ?
- Quel lien entre le DM et les statistiques, quelle dépendance entre le DM et l’ « informatique » ?
- Les attentes des entreprises, les réponses du DM.
- Les principales applications du DM
2/ Mise en place d’une solution de Datamining
2.1 Les données de l’entreprise : entre qualité et quantité ?
-Les différents types de données.
-Qualité des données et administration des données.
-Processus de collecte et d’exploration.
-Création d’agrégats et de nouvelles données.
-Transformation des données.
2.2 Méthodologie de projet
-Définition du problème métier à résoudre et des objectifs à atteindre.
-Inventaire, description et classement des données.
-Exploration, segmentation des entités analysées.
-Etablissement du ou des modèles d’analyse.
-Application des modèles et validation des résultats.
-Itérations, déploiement auprès des utilisateurs (formation, accompagnement du changement…).
-Maintenance du modèle et logiciel associé.
2.3/ Panorama des outils
-Les principaux outils : SAS, R, Python, KNIME, IBM SPSS, Oracle Data Mining, SQL Server DM…
-Zoom sur un ou deux outils au choix (de préférence KNIME, open source et code free, possibilité de pratiquer en séance)
-Quels critères de choix pour ce type d’outils ?
3/ Les techniques du Data Mining
-Les différentes familles du DM : apprentissage supervisé, non supervisé
-L’analyse factorielle, la classification ou clustering, la détection de liens.
-Les arbres de décisions, les forêts aléatoires, les SVM, les réseaux de neurones, les modèles paramétriques.
-Classification des techniques de DM : Quelle technique choisir pour un type de problème donné ?
4/ Méthodologie et applications
4.1/ Construire une segmentation clients
-Définition et méthodologie.
-Choix des critères pour structurer les données à classer. Combien de classes viser ?
-Utilisation de variables.
-Evaluation et validation des classes obtenues. Comment mesurer la qualité d’une bonne segmentation ?
-Utilisations pratiques
4.2/ Le Scoring : prédire un évènement
-Définition du Scoring.
-Dans quels domaines d’activité est-il utilisé ? Pour quel type de problèmes ?
-Quelle est la finalité ?
-Les catégories de Scoring (appétence, risque, octroi).
-La méthodologie de Scoring.
-Cas pratique de Scoring dans une banque ou assurance.
4.3/ Les systèmes de recommandations de produits
- De quoi s’agit-il ?
-Technique et méthodologie
-Dans quels domaines d’activité sont-ils utilisés ? Quel type d’utilisation ?
-Cas pratique
Méthodes Pédagogiques
Cas pratiques
Support de cours
Modalités d'évaluation
Questionnaire de positionnement Evaluation en cours de formation : exercices Evaluation de fin de formation : Qcm Bilan individuel des compétences acquises Questionnaire de satisfaction à chaud Attestation de fin de formation
Accessibilité
Nous consulter
Date de modification
23/03/2023