3A IF, WMMFB40
Traitement des données temps réel et données hétérogénes
(Partie II: Extraction et Recommendation)

 

Programme


S. I   Algorithmes de partitionnement, modèles de mélange
Le partitionnement a pour but l'identification de classes disjointes de documents au sein d'une collection donnée. Ce cours présente les algorithmes de base en partitionnement ainsi qu'une introduction aux modèles de mélange.
TP
Indexation d'une collection textuelle, PLSA

S. II   Analyse sémantique latente probabiliste
Ce cadre s’appuie sur une vision générative de la cooccurrence entre un document et un terme, et il associe une variable de classe non observée (ou latente) à chaque occurence de terme dans un document.






Bibliographies