MOOCs gratuits : catalogue de cours en ligne ouverts et massifs

MOOC Analyse des données multidimensionnelles

Inscriptions ouvertes jusqu'au 4 avril 2016

Ce MOOC vous aide à comprendre et à appliquer les quatre méthodes fondamentales de l'analyse des données : analyse en composantes principales, analyse des correspondances simple et multiple, classification.

MOOC sur FUN-MOOC - du 1.03.16 au 11.04.2016
Auteur(s): François Husson, Jérôme Pagès, Magalie Houée-Bigot

Présentation du MOOC Analyse des données multidimensionnelles (session 2)

Informations pratiques sur le MOOC Analyse des données multidimensionnelles

  • Type: MOOC, cours en ligne, quiz autocorrectifs, exercices sur table et mini-projets, attestation de suivi
  • Temps d'apprentissage: 5 semaines
  • Niveau: à partir du niveau master
  • Durée: 05:00h/semaine
  • Langues: Français
  • Contenu: vidéos
  • Public cible: étudiants et professionnels ayant un niveau master et/ou des connaissances dans une discipline scientifique
  • Age attendu: 21 et +
  • Droits: Licence Creative Commons BY NC ND

Description du MOOC Analyse des données multidimensionnelles

L'objectif de ce MOOC est de vous faire comprendre et appliquer les quatre méthodes fondamentales de l'analyse des données :

  • analyse en composantes principales
  • analyse factorielle des correspondances
  • analyse des correspondances multiples
  • classification ascendante hiérarchique

Une extension vers l'analyse factorielle multiple permettra d'aborder le traitement de données plus complexes (nouveauté par rapport à la première édition).

Une large place est donnée aux exemples et à la mise en œuvre logicielle (logiciel FactoMineR de R). La présentation des méthodes recourt le moins possible au formalisme mathématique et privilégiel'approche géométrique.

Plan du MOOC

Semaine 1 : Analyse en composantes principales

  • Données, problématique et exemples
  • Recherche d'une représentation des individus
  • nterprétation de la représentation des individus grâce aux variables
  • Représentation des variables
  • Aides à l'interprétation
  • Mise en œuvre sous FactoMineR

Semaine 2 : Analyse factorielle des correspondances

  • Données, notations, questions
  • Liaison et indépendance entre deux variables qualitatives
  • Comment l'A.F.C. appréhende-t-elle l'écart à l'indépendance ?
  • Nuage des lignes et des colonnes et leur représentation
  • Pourcentages d'inertie et inerties en A.F.C.
  • Représentation simultanée des lignes et des colonnes
  • Aides à l'interprétation
  • Mise en œuvre sous FactoMineR

Semaine 3 : Analyse des correspondances multiples

  • Données, objectifs et problématique
  • Transformation du tableau des données
  • Représentation des individus
  • Représentation des modalités comme aide à l'interprétation de la représentation des individus
  • Nuage des modalités et sa représentation optimale
  • Représentation simultanée des deux nuages
  • Interprétation des valeurs propres
  • Représentation des variables
  • Aides à l'interprétation
  • Tableau de Burt
  • Mise en œuvre sous FactoMineR

Semaine 4 : Classification

  • Données, définitions
  • Principe de construction d'un arbre hiérarchique
  • Algorithme de partitionnement : les K-means
  • Consolidation des classes
  • Classification sur données de grande dimension
  • Analyse factorielle et classification
  • Caractérisation des classes d'individus
  • Mise en œuvre sous FactoMineR

Semaine 5 : Analyse Factorielle Multiple

  • Données, problématique
  • Equilibre des groupes et choix d'une pondération des variables
  • Etude et représentation des groupes de variables
  • Représentation des points partiels
  • Représentation des analyses séparées
  • Prise en compte de groupes de variables qualitatives
  • Prise en compte de tableaux de contingence
  • Aide à l'interprétation
  • Mise en œuvre sous FactoMineR

Évaluation

L'évaluation de vos connaissances se fera en continu, sur la base de quiz autocorrectifs qui vous seront proposés à l'issue de chaque vidéo. Par ailleurs, des exercices sur table et des mini-projets vous donneront l'occasion de mettre en œuvre les méthodes sur logiciel et d'échanger sur les forums. Les réponses aux quiz et aux exercices vous permettront d'obtenir une attestation de suivi avec succès.

Informations pédagogiques

Public

  • Public visé : Ce MOOC a été conçu pour ceux qui, sans être statisticiens, sont confrontés à l'analyse statistique de données. Tous les domaines où l'on recueille des données sont concernés :
    • enquêtes d'opinion
    • marketing
    • biologie
    • écologie
    • géographie
    • etc.
  • Pré-requis : Ce MOOC est destiné aux étudiants et professionnels ayant un niveau master ou des connaissances dans une discipline scientifique. Des connaissances de base en statistique sont nécessaires :
    • coefficient de corrélation
    • test du Chi2
    • analyse de variance à un facteur
      Une initiation au langage R est suffisante pour la mise en oeuvre concrète des méthodes.

Objectif pédagogique du MOOC Analyse des données multidimensionnelles

  • Objectif : Vous rendre autonome dans la mise en œuvre et l'interprétation d'analyses exploratoires multidimensionnelles.

Édition et diffusion du MOOC Analyse des données multidimensionnelles (session 2)

Édition

Diffusion

Conditions d'utilisation

  • Du cours : Licence Creative Commons BY NC ND. L'utilisateur doit mentionner le nom de l'auteur, il peut exploiter l'œuvre sauf dans un contexte commercial, il ne peut pas créer une œuvre dérivée de l'œuvre originale.
  • Du contenu produit par les internautes : Licence restrictive : votre production relève de votre propriété intellectuelle et ne peut donc pas être réutilisée.

Documents annexes - MOOC Analyse des données multidimensionnelles (session 2)

Lecture recommandée

Ce MOOC est repris et développé dans le livre :

  • Husson, F., Pagès, J. et S. Lê . Analyse de données avec R. Presses Universitaires de Rennes, 2009
1ère publication : 7.01.2016 - Mise à jour : 12.01.2016