offres d'emploi formations actualités contact accès annuaire intranet
Thèses >

Intelligence Artificielle : simulation en arbre et génétique

Habilitation à diriger des recherches

Fabien Teytaud

lundi 2 décembre 2019 à 10h00

amphi C002


Cette thèse se situe dans le contexte de l’intelligence artificielle. Deux grandes parties s’en dégagent. La première concerne l’utilisation d’algorithme d’apprentissage par renforcement dans le contexte applicatif des jeux et des problèmes d’optimisation combinatoire. La seconde concerne l’utilisation de la programmation génétique comme générateur de procédés de pondération pour la catégorisation de texte. Dans le cadre de l’apprentissage par renforcement, nous nous intéressons particulièrement aux méthodes de type Monte-Carlo Tree Search et ses variantes, comme la recherche Nested. Dans cette partie, nous nous intéressons tout d’abord à une étude sur l’importance des aspects tactiques et stratégiques dans un jeu. Ces aspects influencent les performances des algorithmes de fouille d’arbre Monte-Carlo, et nous souhaitons en particulier comprendre comment ces informations peuvent être prises en compte dans l’apprentissage de politiques Monte-Carlo. Nous montrons ensuite la généricité de ces méthodes, en mesurant leur efficacité sur des problèmes d’optimisation combinatoire classiques, et en obtenant des records mondiaux sur certains de ces problèmes. Dans la seconde partie, nous nous intéressons au problème de la classification de texte. Dans cette famille de problèmes, une sous catégorie est la classification multi-étiquettes : dans ce cas, un exemple d’apprentissage peut appartenir à plusieurs classes, ce qui complique grandement la tache. Un des points crucial dans la classification de texte, est la pondération des termes. Nous faisons tout d’abord une étude des différents procédés de pondération afin d’étudier leur comportement et leur performance. Ensuite, nous définissons un nouveau procédé, qui est, en particulier, plus efficace lorsqu’on s’intéresse justement à de la classification multi-étiquettes. Beaucoup des procédés état de l’art sont basés sur des intuitions et des règles statistiques. Aujourd’hui, dans le monde de l’intelligence artificielle, un point intéressant est d’essayer d’avoir des méthodes qui soit indépendantes des connaissances expertes, et donc parfaitement autonomes. Afin d’aller dans cette direction, nous avons utilisé la programmation génétique pour générer automatiquement des procédés de pondération de termes. Nous montrons que les procédés ainsi générés sont très efficaces, et surtout très robustes. Certains sont d’ailleurs parfaitement interprétables et explicables pour un expert.