Massih-Reza AMINI - Traitement des données temps réel et données hétérogénes (3A IF, WMMFB40)<br>

3A IF, WMMFB40
Traitement des données temps réel et données hétérogénes
(Partie II: Extraction et Recommendation)

Programme

S. I		Algorithmes de partitionnement, modèles de mélange Le partitionnement a pour but l'identification de classes disjointes de documents au sein d'une collection donnée. Ce cours présente les algorithmes de base en partitionnement ainsi qu'une introduction aux modèles de mélange.	TP Indexation d'une collection textuelle, PLSA
S. II		Analyse sémantique latente probabiliste Ce cadre s'appuie sur une vision générative de la cooccurrence entre un document et un terme, et il associe une variable de classe non observée (ou latente) à chaque occurence de terme dans un document.
S. III		Système de recommandation Nous présentons les fondements des systèmes de recommandation ainsi que le modèle qui a gagné le prix Netflix.	TP Système de recommandation par décomposition matricielle

Bibliographies

[1]

Recherche d'Information - Applications, modèles et algorithmes

[2]

Probabilistic Latent Semantic Analysis

[3]

Introduction to Information Retrieval

[4]

Managing Gigabytes