Data science
Master 2 ISIDIS - 2016/2017
But
S'initier à la science des données qui consiste à résoudre des problèmes en s'appuyant les informations contenues dans les données. Cet enseignement est à la croisée du machine learning, du big data, du noSQL, etc. Il introduit aux notions des bases du métier de data scientist et s'appuie sur des exemples pratiques.
hautEvaluation
L'évaluation comprend :
- 2 Projets notés, 40%,
- 1 écrit terminal, 60%, le xx/01/2017 de 10h à 12h.
Enoncé du projet pdf avec les données csv (30Mo) relatives. Le projet est à rendre le 30/11/2016 avant minuit.
Cette matière appartient à l'UE "Data warehouse and data science" comptant pour 4 crédits ECTS.
haut
Équipe d'enseignants
Sébastien Verel
Pour contacter un des intervenants : contacts.
Vous pouvez contacter l'équipe pour tout ce qui concerne cet enseignement et votre orientation.
Supports de Cours et de TP
Voici l'ensemble des supports de cours et des énoncés des TP.
Séance | Titre | cours | TD | TP |
---|---|---|---|---|
01 | Introduction | cours |
td | tp |
02 | Base du data scientist | cours aide R | td | data |
03 | Les outils avancés du data scientist | cours | g.b. | tpdata |
04 | Hadoop HDFS | cours | td | tp |
05 | Hadoop Map-reduce | cours | td | tp code |
06 | Introduction au noSQL | cours | td | tp hive |
exposés étudiants | mongoDB | CouchDB |
Bibliographie
Quelques repères biblio- /webo- graphiques qui vont se complèter au fur et à mesure :
- Cours Programmation Parallèle et Distribué, Bilel Derbel, Université de Lille 1.
- Cours big data, Benjamin Renaut, MBDS univesité de Nice Sophia Antipolis
- Documentation officielle HDFS sur Hadoop/Apache
- Tutorial de Yahoo
- Tutoriel Map-Reduce de Hadoop
- Tutoriel de Jonas Widriksson pour installer Hadoop sur un cluster de raspberry pi
dernière modification : 11 décembre 2015