offres d'emploi formations actualités contact accès annuaire intranet
Thèses >

Méthodes informées de factorisation matricielle non négative. Application à l’identification de sources de particules industrielles.

Abdelhakim LIMEM - manuscrit

vendredi 21 novembre 2014 à 13h00

amphi C002


Les méthodes aveugles de NMF permettent la factorisation d’une séquence de données d’observations non-négatives — rangées sous la forme d’une matrice X — en le produit X=G . F de deux matrices non-négatives G et F, dont les lignes contiennent respectivement les contributions instantanées d’un mélange des sources et les signatures de ces sources. Bien que ces approches sont étudiées avec grand intérêt par la communauté scientifique, elles souffrent bien souvent d’un manque de robustesse vis à vis des données et des conditions initiales. Par ailleurs, la méthode NMF classique présente l’inconvénient des solutions multiples. Dans cette optique et afin de réduire l’espace des solutions admissibles, les travaux de cette thèse ont pour objectif d’ajouter des informations expertes — fonction de l’application — à la NMF, positionnant ainsi nos travaux entre la régression et les factorisations aveugles classiques. Par ailleurs, des fonctions de coûts paramétriques appelées divergences αβ sont utilisées, permettant de tolérer la présence d’aberrations dans les données.

Nous introduisons trois types de contraintes recherchées sur la matrice F à savoir (i) la connaissance exacte ou bornée de certains de ses éléments et (ii) la somme à 1 de chacune de ses lignes. L’enjeu de ce travail est de proposer des règles de mise à jour permettant de faire cohabiter l’ensemble de ces contraintes par des méthodes multiplicatives mixées à des projections.

D’autre part, nous proposons de contraindre la structure de la matrice G par l’usage d’un modèle physique susceptible de distinguer les sources présentes au niveau du récepteur.

Une application de séparation de sources de particules en suspension dans l’air autour d’une région industrielle du littoral nord de la France, a permis de tester l’intérêt de l’approche. A travers une série de tests sur des données synthétiques et réelles, nous montrons l’apport des différentes informations pour rendre les résultats de la factorisation plus cohérents du point de vue de l’interprétation physique et moins dépendants de l’initialisation.