offres d'emploi formations actualités contact accès annuaire intranet
Thèses >

Informed Non-Negative Matrix Factorization for Source Apportionment

Robert Chreiky

mardi 19 décembre 2017 à 10h00

Salle B014


Le démélange de sources pour la pollution de l’air peut être formulé comme un problème de NMF en décomposant la matrice d’observation X en le produit de deux matrices non négatives G et F, repectivement la matrice de contributions et de profils. Généralement, les données chimiques sont entâchées d’une part de données aberrantes. En dépit de l’intérêt de la communauté pour les méthodes de NMF, elles souffrent d’un manque de robustesse à un faible nombre de données aberrantes et aux conditions initiales et elles fournissent habituellement de multiples minima. En conséquence, cette thèse est orientée d’une part vers les méthodes de NMF robustes et d’autre part vers les NMF informées qui utilisent une connaissance experte particulière.

Deux types de connaissances sont introduites dans la matrice de profil F. La première hypothèse est la connaissance exacte de certaines composantes de la matrice F tandis que la deuxième information utilise la propriété de somme-à-1 de chaque ligne de la matrice F. Une paramétrisation qui tient compte de ces deux informations est développée et des règles de mise à jour dans le sous-espace des contraintes sont proposées.

L’application cible qui consiste à identifier les sources de particules dans l’air dans la région côtière du nord de la France montre la pertinence des méthodes proposées. Dans la série d’expériences menées sur des données synthétiques et réelles, l’effet et la pertinence des différentes informations sont mises en évidence et rendent les résultats de factorisation plus fiables.

Mots-clés : Factorisation matricielle non-négative Informée, Robustesse, Pollution de l’air.