MOOCs gratuits : catalogue de cours en ligne ouverts et massifs

MOOC Fondamentaux pour le Big Data

Inscriptions au MOOC ouvertes jusqu'au 1er octobre 2018

Le MOOC Fondamentaux pour le big data vous permet d'acquérir le niveau pré-requis en informatique et en statistiques pour suivre des formations dans le domaine du big data et data science.

MOOC sur FUN-MOOC - du 20.11.17 au 4.10.2018
Auteur(s): Stéphan Clémençon, Pierre Senellart, Anne Sabourin, Joseph Salmon, Alexandre Gramfort, Ons Jelassi

Présentation du MOOC Fondamentaux pour le Big Data

Informations pratiques sur le MOOC

  • Type: MOOC, cours en ligne, quiz, attestation de suivi
  • Temps d'apprentissage: 6 semaines
  • Niveau: à partir de la licence (L2 validé)
  • Durée d'exécution: 04:00h/semaine
  • Langues: français
  • Contenu: vidéos, discussions
  • Public cible: personnes ayant une formation en mathématiques, suivant un master spécialisé "Big data Gestion et analyse des données massives", ou le Certificat d'Études Spécialisées "Data Scientis" ou la formation courte "Data Science : Introduction au Machine Learning"
  • Age attendu: 20 ans et +
  • Droits: Licence Creative Commons BY-NC-ND

Description du MOOC Fondamentaux pour le Big Data

Ce MOOC va vous permettre d'acquérir de façon efficace le niveau prérequis en informatique et en statistiques pour suivre des formations dans le domaine du big data et data science.

Le big data offre de nouvelles opportunités d'emplois au sein des entreprises et des administrations. De nombreuses formations préparant à ces opportunités de métiers existent. Le suivi de ces formations nécessite des connaissances de base en statistiques et en informatique que ce MOOC vous propose d'acquérir dans les domaines de :

  • l'analyse
  • l'algèbre
  • les probabilités
  • les statistiques
  • la programmation Python
  • les bases de données.


D'une part, les bases de données relationnelles ne sont pas toujours adaptées aux systèmes de données massives qui sont déployées dans les contextes big data. Ce MOOC vous explique pourquoi.

D'autre part, le langage Python est un langage très utilisé dans le domaine du traitement des masses de données. Ce MOOC vous initie à la programmation avec ce langage, surtout en utilisant la bibliothèque Numpy.

Enfin, le traitement des données massives et la prédiction nécessitent des analyses statistiques. Cette formation vous fournit les concepts élémentaires en statistiques tels que :

  • les variables aléatoires
  • le calcul différentiel
  • les fonctions convexes
  • les problèmes d'optimisation
  • les modèles de régression

Ces bases sont appliquées sur un algorithme de classification le Perceptron.

Déroulement du MOOC

Ce MOOC est ouvert à la demande : vous pouvez vous inscrire quand vous le souhaitez, et avancer à votre rythme. Il comporte 6 semaines, chaque partie se termine par un quiz validant les acquis des différentes sessions vidéos. Un quiz final faisant suite à un projet validera l'ensemble du MOOC. Vous pouvez passer vos quiz et travailler sur votre mini-projet quand vous le souhaitez. Néanmoins, il faudra patienter un peu pour obtenir votre attestation : il y aura 3 sessions d'évaluation dans l'année :

  • le 16 mars 2018
  • le 20 juillet 2018
  • le 22 novembre 2018

Les forums de discussions seront animés une demi-journée par semaine.

Plan du MOOC

  • Semaine 0 : Introduction : Les enjeux du Big Data et de ce MOOC
  • Semaine 1 : Python Partie 1 / Algèbre Partie 1
  • Semaine 2 : Limites des bases de données relationnelles / Python Partie 2/ Algèbre Partie 2
  • Semaine 3 : Probabilités Partie 1/ Analyse Partie 1
  • Semaine 4 : Probabilités Partie 2/ Analyse Partie 2
  • Semaine 5 : Statistique
  • Semaine 6 : Le classifieur Perceptron

Évaluation

Chaque partie se termine par un quiz. La réponse au projet final se fait sous forme de quiz. La réussite de ces quiz avec 70% en global permet d'obtenir une attestation de suivi avec succès.

Informations pédagogiques

Public

  • Public visé : Ce MOOC peut être suivi en préparation du Mastère Spécialisé "Big data : Gestion et analyse des données massives", du Certificat d'Études Spécialisées « Data Scientist » et de la formation courte « Data Science : Introduction au Machine Learning ».
  • Pré-requis : Ce MOOC s'adresse à des personnes ayant des bases en mathématiques et en algorithmique (niveau L2 validé) et qui ont besoin d'un rafraichissement de leurs connaissances pour suivre des formations en data science et big data. Il peut être suivi en préparation du Mastère Spécialisé "Big data : Gestion et analyse des données massives", du Certificat d'Études Spécialisées « Data Scientist » et de la formation courte "Data Science : Introduction au Machine Learning".

Objectif pédagogique du MOOC

  • Objectif : Ce MOOC a pour but de vous :
    • expliquer pourquoi les bases de données relationnelles ne sont pas toujours adaptées aux systèmes de données massives utiliséees dans les contextes big data
    • initier à la programmation avec le langage Python en utilisant la bibliothèque Numpy
    • fournir les concepts élémentaires en statistiques tels que :
      • les variables aléatoires
      • le calcul différentiel
      • les fonctions convexes
      • les problèmes d'optimisation
      • les modèles de régression
    • permettre d'acquérir le niveau prérequis en informatique et en statistiques

Édition et diffusion du MOOC Fondamentaux pour le Big Data

Édition

Diffusion

Conditions d'utilisation

  • Du cours : Licence Creative Commons BY-NC-ND : l'utilisateur doit mentionner le nom d'auteur, il peut exploiter l'oeuvre sauf dans un contexte commercial, il ne peut pas créer une oeuvre dérivée de l'oeuvre originale.
  • Du contenu produit par les participants : Licence restrictive : votre production relève de votre proprieté intellectuelle et ne peut donc pas être réutilisée.

Documents annexes - MOOC Fondamentaux pour le Big Data

MOOCs recommandés

Publication : 11.12.2017