Data science
Master 2 ISIDIS - 2018/2019
But
S'initier à la science des données qui consiste à résoudre des problèmes en s'appuyant les informations contenues dans les données. Cet enseignement est à la croisée du machine learning, du big data, du noSQL, etc. Il introduit aux notions des bases du métier de data scientist et s'appuie sur des exemples pratiques.
hautEvaluation
Support des exposé sur le nosql :
- couchDB, auteurs: Laniesse, Tholliez, pdf
- riak, auteurs: Ehinger, Lannoye, pdf
- Cassandra, auteurs: Pestelle, Specq, pdf
- Redis, auteurs: Coloos, Prunier, pdf
- NEo4j, auteurs: Focqueu, Foucaudpdf
L'évaluation comprend :
- à déterminer
Cette matière appartient à l'UE "Data science" comptant pour 4 crédits ECTS.
haut
Équipe d'enseignants
Fabien Teytaud
Sébastien Verel
Pour contacter un des intervenants : contacts.
Vous pouvez contacter l'équipe pour tout ce qui concerne cet enseignement et votre orientation.
Supports de Cours et de TP
Voici l'ensemble des supports de cours et des énoncés des TP.
Séance | Titre | cours | TD | TP |
---|---|---|---|---|
01 | Introduction | cours |
td | tp |
02 | Hadoop HDFS | cours | td | tp |
03 | Hadoop Map-reduce | cours | td | tp code |
04 | Introduction au noSQL | cours | td | tp hive |
Bibliographie
Quelques repères biblio- /webo- graphiques qui vont se complèter au fur et à mesure :
- Cours Programmation Parallèle et Distribué, Bilel Derbel, Université de Lille 1.
- Cours big data, Benjamin Renaut, MBDS univesité de Nice Sophia Antipolis
- Documentation officielle HDFS sur Hadoop/Apache
- Tutorial de Yahoo
- Tutoriel Map-Reduce de Hadoop
- Tutoriel de Jonas Widriksson pour installer Hadoop sur un cluster de raspberry pi
dernière modification : 21 septembre 2018