Conférence de Simon Lacoste-Julien - Candidat au poste de professeur en informatique

Date :: Cet événement est passé.
Type :: Conférences et séminaires
Lieu :: D4-2011, Faculté des sciences

Description :

Titre : Exploiter la structure des données pour l'apprentissage automatique discriminatif

Conférencier : Simon Lacoste-Julien
École Normale Supérieure, Paris

Résumé

Le domaine de l'apprentissage automatique s'est grandement développé durant les deux dernières décennies, avec un impact dans des domaines divers tels que la vision par ordinateur, le traitement automatique du langage, la biologie computationnelle et les sciences sociales. Par contre, ces nouvelles applications ont mis en évidence que les données issues de tâches réelles possèdent souvent une structure plus riche que celle normalement modélisée par les paradigmes classiques, tels que la classification binaire ou la régression. En traduction automatique par ordinateur, par exemple, l'algorithme doit choisir parmi un nombre exponentiel de séquences de mots possibles en tant que traduction, et non un simple petit nombre de choix tel que pour la reconnaissance automatique de chiffres écrits. Un défi clé pour le domaine de l'apprentissage automatique moderne est de trouver des moyens de modéliser les structures complexes de manière évolutive (scalable) tout en restant robuste à la mauvaise spécification du modèle. Dans cette présentation, je vais exposer comment exploiter deux types de structure sur les données : une structure combinatoire représentée par des graphes pour la tâche d'alignement de mots pour le traitement automatique du langage ou l'alignement de bases de connaissances pour le Web sémantique; et une structure probabiliste avec variable latente utilisée dans la modélisation de texte pour la classification automatique de documents et la recherche d'informations. Une contribution clé de l'approche proposée est de rendre les modèles robustes en les apprenant avec un critère d'apprentissage "discriminatif", ce qui permet d'obtenir des gains substantiels de performance. Un autre thème clé sera la "scalabilité" - je vais expliquer comment utiliser des outils modernes d'optimisation pour maintenir cette propriété. Ces exemples mettront en évidence comment l'applicabilité des algorithmes d'apprentissage automatique peut être accrue en exploitant de manière plus appropriée la structure des données complexes, ce qui motivera mon projet futur de développer un cadre théorique et algorithmique général pour la prédiction structurée robuste et efficace.

Biographie

Simon Lacoste-Julien est actuellement boursier de la Ville de Paris à l'École Normale Supérieure et INRIA. Il a complété un B.Sc. Triple Honours en mathématiques, physique et informatique à l'Université McGill en 2003, un Ph.D. en informatique et statistiques à UC Berkeley en 2009 sous la supervision de Michael I. Jordan, et il a ensuite travaillé en tant que postdoc avec Zoubin Ghahramani à l'Université Cambridge. Il a obtenu la McGill Moyse Travelling Scholarship ainsi que le UC Berkeley College of Engineering Graduate Student Prize. Ses travaux de recherche portent sur l'apprentissage automatique, l'optimisation et les statistiques, avec comme applications le traitement automatique du langage, la vision par ordinateur et la recherche d'informations

Toutes les personnes intéressées sont invitées.