Data science
Master 2 ISIDIS - 2015/2016
But
S'initier à la science des données qui consiste à résoudre des problèmes en s'appuyant les informations contenues dans les données. Cet enseignement est à la croisée du machine learning, du big data, du noSQL, etc. Il introduit aux notions des bases du métier de data scientist et s'appuie sur des exemples pratiques.
hautEvaluation
L'évaluation comprend :
- 2 Projets notés, 40%,
- 1 écrit terminal, 60%, le 08/01/2016 de 10h à 12h.
Projet de data science: l'énoncé est ici (pdf). Le projet est à rendre pour le 15 janvier 2016 avant 23h59.
Cette matière appartient à l'UE "Data warehouse and data science" comptant pour 4 crédits ECTS.
haut
Équipe d'enseignants
Sébastien Verel
Pour contacter un des intervenants : contacts.
Vous pouvez contacter l'équipe pour tout ce qui concerne cet enseignement et votre orientation.
Supports de Cours et de TP
Voici l'ensemble des supports de cours et des énoncés des TP.
Séance | Titre | cours | TD | TP |
---|---|---|---|---|
01 | Introduction | cours |
td | tp |
02 | Base du data scientist | cours aide R | td | data |
03 | Les outils avancés du data scientist | cours | g.b. | tp |
04 | Hadoop HDSF | cours | td | tp |
05 | Hadoop Map-reduce | cours | td | tp code |
06 | Introduction au noSQL | cours | td | tp hive |
07 | Big data et machine learning | projet |
Bibliographie
Quelques repères biblio- /webo- graphiques qui vont se complèter au fur et à mesure :
- Cours Programmation Parallèle et Distribué, Bilel Derbel, Université de Lille 1.
- Cours big data, Benjamin Renaut, MBDS univesité de Nice Sophia Antipolis
- Documentation officielle HDFS sur Hadoop/Apache
- Tutorial de Yahoo
- Tutoriel Map-Reduce de Hadoop
- Tutoriel de Jonas Widriksson pour installer Hadoop sur un cluster de raspberry pi
dernière modification : 11 décembre 2015