MOOCs gratuits : catalogue de cours en ligne ouverts et massifs

MOOC Fondamentaux pour le Big Data

Inscriptions au MOOC ouvertes jusqu'au 18 juillet 2017

Le MOOC Fondamentaux pour le big data vous permet d'acquérir le niveau pré-requis en informatique et en statistiques pour suivre des formations dans le domaine du big data et data science.

MOOC sur FUN-MOOC - du 6.06.17 au 1.08.2017
Auteur(s): Stéphan Clémençon, Pierre Senellart, Anne Sabourin, Joseph Salmon, Alexandre Gramfort, Ons Jelassi

Présentation du MOOC Fondamentaux pour le Big Data

Informations pratiques sur le MOOC

  • Type: MOOC, cours en ligne, quiz, attestation de suivi
  • Temps d'apprentissage: 6 semaines
  • Niveau: à partir de la licence (L2 validé)
  • Durée d'exécution: 04:00h/semaine
  • Langues: français
  • Contenu: vidéos, discussions
  • Public cible: personnes ayant une formation en mathématiques, suivant un master spécialisé "Big data Gestion et analyse des données massives", ou le Certificat d'Études Spécialisées "Data Scientis" ou la formation courte "Data Science : Introduction au Machine Learning"
  • Age attendu: 20 ans et +
  • Droits: Licence Creative Commons BY-NC-ND

Description du MOOC Fondamentaux pour le Big Data

Le big data offre de nouvelles opportunités d'emplois au sein des entreprises et des administrations. Des formations préparant à ces métiers existent. Ces formations nécessitent des connaissances en statistiques et en informatique que ce MOOC vous propose d'acquérir.

En suivant ce MOOC vous pourrez avoir des bases dans les domaines de :

  • l'analyse
  • l'algèbre
  • les probabilités
  • les statistiques
  • la programmation Python
  • les bases de données

Ce MOOC vous explique pourquoi les bases de données relationnelles ne sont pas toujours adaptées aux systèmes de données massives qui sont déployées dans les contextes big data.

Ce MOOC vous initie à la programmation avec le langage Python, très utilisé dans le domaine du traitement des masses de données en utilisant la bibliothèque Numpy.

Le traitement des données massives et la prédiction nécessitent des analyses statistiques. Cette formation vous fournit les concepts élémentaires en statistiques comme :

  • les variables aléatoires
  • le calcul différentiel
  • les fonctions convexes
  • les problèmes d'optimisation
  • les modèles de régression

Ces bases sont appliquées sur un algorithme de classification le Perceptron.

Déroulement du MOOC

Ce MOOC est précédé d'un quiz de validation de niveau. Il est constitué de 7 parties et organisée en 6 semaines. Chaque partie se termine par un quiz validant les acquis des différentes sessions vidéos. Un quiz final faisant suite à un projet validera l'ensemble du MOOC.

Plan du MOOC

  • Semaine 0 : Introduction : Les enjeux du Big Data et de ce MOOC
  • Semaine 1 : Python Partie 1 / Algèbre Partie 1
  • Semaine 2 : Limites des bases de données relationnelles / Python Partie 2/ Algèbre Partie 2
  • Semaine 3 : Probabilités Partie 1/ Analyse Partie 1
  • Semaine 4 : Probabilités Partie 2/ Analyse Partie 2
  • Semaine 5 : Statistique
  • Semaine 6 : Le classifieur Perceptron

Évaluation

Chaque partie se termine par un quiz. La réponse au projet final se fait sous forme de quiz. La réussite de ces quiz avec 60% par thème et 70% en global permet d'obtenir une attestation de suivi avec succès.

Informations pédagogiques

Public

  • Public visé : Ce MOOC peut être suivi en préparation du Mastère Spécialisé "Big data : Gestion et analyse des données massives", du Certificat d'Études Spécialisées "Data Scientist" et de la formation courte "Data Science : Introduction au Machine Learning".
  • Pré-requis : Ce MOOC s'adresse à des personnes ayant des bases en mathématiques et en algorithmique (niveau L2 validé) et qui ont besoin d'un rafraichissement de leurs connaissances pour suivre des formations en data science et big data.

Objectif pédagogique du MOOC

  • Objectif : Ce MOOC a pour but de vous :
    • expliquer pourquoi les bases de données relationnelles ne sont pas toujours adaptées aux systèmes de données massives utiliséees dans les contextes big data
    • initier à la programmation avec le langage Python en utilisant la bibliothèque Numpy
    • fournir les concepts élémentaires en statistiques tels que :
      • les variables aléatoires
      • le calcul différentiel
      • les fonctions convexes
      • les problèmes d'optimisation
      • les modèles de régression
    • permettre d'acquérir le niveau prérequis en informatique et en statistiques

Édition et diffusion du MOOC Fondamentaux pour le Big Data

Édition

Diffusion

Conditions d'utilisation

  • Du cours : Licence Creative Commons BY-NC-ND : l'utilisateur doit mentionner le nom d'auteur, il peut exploiter l'oeuvre sauf dans un contexte commercial, il ne peut pas créer une oeuvre dérivée de l'oeuvre originale.
  • Du contenu produit par les participants : Licence restrictive : votre production relève de votre proprieté intellectuelle et ne peut donc pas être réutilisée.

Documents annexes - MOOC Fondamentaux pour le Big Data

MOOCs recommandés

1ère publication : 11.01.2017 - Mise à jour : 15.05.2017