Génération de requêtes pour les systèmes de Q/R avec un modèle d'apprentissage statistique


Nicolas Usunier, Massih-Reza Amini, Patrick Gallinari, Brigitte Grau
Laboratoire d'Informatique Paris 6                                         LIMSI
8 rue du capitaine scott                                                 Orsay France


Nous présentons dans cet article un modèle d'apprentissage permettant de générer des requêtes booléennes pour les systèmes de question/réponse qui peut-être employé aussi bien sur des collections fermées que sur l'internet. Nous proposons deux approches pour cette tâche de génération. Dans la première, le modèle est entraîné à faire de la classification de requêtes. La seconde approche est nouvelle et consiste à entraîner le modèle à comparer les requêtes entre elles afin de les ordonner. Dans ce cadre, le modèle est appris pour prendre en compte les dépendances entre les requêtes générées à partir d'une même question. Nous évaluons les deux approches proposées sur les questions de l'évaluation TREC 11 et sur le corpus de documents Aquaint, utilisé lors de cette même évaluation.