Data science

Master 2 ISIDIS - 2019/2020

But

S'initier à la science des données qui consiste à résoudre des problèmes en s'appuyant les informations contenues dans les données. Cet enseignement est à la croisée du machine learning, du big data, du noSQL, etc. Il introduit aux notions des bases du métier de data scientist et s'appuie sur des exemples pratiques.

haut

Evaluation

L'évaluation comprend :

  • à déterminer

Cette matière appartient à l'UE "Data science" comptant pour 4 crédits ECTS.

haut

Équipe d'enseignants

Fabien Teytaud

Sébastien Verel

Pour contacter un des intervenants : contacts. Vous pouvez contacter l'équipe pour tout ce qui concerne cet enseignement et votre orientation.

haut

Objectifs

Ils sont mis à jour régulièrement :

  1. Connaitre le contexte societal, économique, etc. de "data science"
  2. Savoir définir "big data", "data science"
  3. Connaitre l'architecture HDFS
  4. Savoir expliquer les prinicpes de HDFS
  5. Connaitre les points critiques en algorithmique distribuée
  6. Connaitre l'algorithme map-reduce
  7. Savoir l'architecture de Haddop
  8. Savoir dévepper un algorithme map-reduce
  9. Connaitre les différences en SQL et noSQL
  10. Connaitre les organisations de données noSQL
  11. Savoir expliquer les principes noSQL
  12. Connaitre les architectures noSQL
  13. Connaitre les grands principes techniques mis en oeuvre en noSQL
  14. Connaitre finement au moins un BD noSQL

haut

Supports de Cours et de TP

Voici l'ensemble des supports de cours et des énoncés des TP.

Séance Titre cours TD TP
01 Introduction cours
td tp
02 Hadoop HDFS cours td tp
03 Hadoop Map-reduce cours td tp code
04 Introduction au noSQL cours td tp hive

haut

Bibliographie

Quelques repères biblio- /webo- graphiques qui vont se complèter au fur et à mesure :

haut

Horaires

9h de CM, 9h de TD, et 10h de TP.


Consulter l'emploi du master : edt

haut

dernière modification : 21 septembre 2018