Data science
Master 2 ISIDIS - 2019/2020
But
S'initier à la science des données qui consiste à résoudre des problèmes en s'appuyant les informations contenues dans les données. Cet enseignement est à la croisée du machine learning, du big data, du noSQL, etc. Il introduit aux notions des bases du métier de data scientist et s'appuie sur des exemples pratiques.
hautEvaluation
L'évaluation comprend :
- à déterminer
Cette matière appartient à l'UE "Data science" comptant pour 4 crédits ECTS.
haut
Équipe d'enseignants
Fabien Teytaud
Sébastien Verel
Pour contacter un des intervenants : contacts.
Vous pouvez contacter l'équipe pour tout ce qui concerne cet enseignement et votre orientation.
Objectifs
Ils sont mis à jour régulièrement :
- Connaitre le contexte societal, économique, etc. de "data science"
- Savoir définir "big data", "data science"
- Connaitre l'architecture HDFS
- Savoir expliquer les prinicpes de HDFS
- Connaitre les points critiques en algorithmique distribuée
- Connaitre l'algorithme map-reduce
- Savoir l'architecture de Haddop
- Savoir dévepper un algorithme map-reduce
- Connaitre les différences en SQL et noSQL
- Connaitre les organisations de données noSQL
- Savoir expliquer les principes noSQL
- Connaitre les architectures noSQL
- Connaitre les grands principes techniques mis en oeuvre en noSQL
- Connaitre finement au moins un BD noSQL
Supports de Cours et de TP
Voici l'ensemble des supports de cours et des énoncés des TP.
Séance | Titre | cours | TD | TP |
---|---|---|---|---|
01 | Introduction | cours |
td | tp |
02 | Hadoop HDFS | cours | td | tp |
03 | Hadoop Map-reduce | cours | td | tp code |
04 | Introduction au noSQL | cours | td | tp hive |
Bibliographie
Quelques repères biblio- /webo- graphiques qui vont se complèter au fur et à mesure :
- Cours Programmation Parallèle et Distribué, Bilel Derbel, Université de Lille 1.
- Cours big data, Benjamin Renaut, MBDS univesité de Nice Sophia Antipolis
- Documentation officielle HDFS sur Hadoop/Apache
- Tutorial de Yahoo
- Tutoriel Map-Reduce de Hadoop
- Tutoriel de Jonas Widriksson pour installer Hadoop sur un cluster de raspberry pi
dernière modification : 21 septembre 2018