Main Page

From Wiki du projet-action Khronos
Revision as of 10:22, 2 March 2015 by Amini (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search

Projet-action Khronos

Labex Persyval, action Advanced Data Mining

The tremendous production of data, known as the big data phenomena, has overturned the classical view in science and information technology domains, notably in the statistical machine learning field. In many real problems, particularly associated with the Internet but not only, massive data streams are continuously produced. This is for example the case of new types of data describing the diffusion of information in social networks (social dynamics), the organization of textual content in blogs (topic models), the various human activities in videos (human action recognition) and the tastes of the users (collaborative filtering) available on the Web. Beyond their sequential nature, the data have generally a complex internal structure, such as those describing the electrical consumption curves, or for which the basic assumption in machine learning stipulating that the observations are identically and independently distributed (iid) with respect to a fixed probability distribution is no longer verified.

The Khronos project aims to

  • establish a new theoretical learning framework that takes into account data that are sequential, interdependent and non-identically distributed;
  • design new models and learning algorithms working on this type of data and that are able to scale.


Le déluge de données (big data) auquel nous assistons ces dernières années bouleverse la vision traditionnelle en sciences et technologies de l'information, et en particulier en apprentissage statistique. Dans de nombreux problèmes réels, en particulier associés à la toile mais pas seulement, un flux massif de données est produit continuellement. C'est par exemple le cas des nouveaux types de données décrivant la diffusion d'information dans des réseaux sociaux (social dynamics), l'organisation des contenus textuels dans les blogs (topic models), les différentes activités humaines dans les vidéos (human action recognition), ainsi que les goûts des utilisateurs (collaborative filtering) disponibles sur la Toile, ou, les courbes de consommation électriques dans les réseaux électriques.

Au-delà de leur caractère séquentiel, ces données peuvent avoir une structure interne complexe, comme celles décrivant les courbes de consommation électriques, ou pour lesquelles l'hypothèse fondamentale en apprentissage automatique stipulant que les observations sont identiquement et indépendamment distribuées (i.i.d.) suivant une distribution de probabilité fixe, n'est plus vérifiée.

Le projet action Khronos vise à

  • établir un nouveau cadre théorique d'apprentissage statistique automatique afin de prendre en compte la nature séquentielle, interdépendante et non-identiquement distribuée des données ;
  • concevoir de nouveaux modèles et algorithmes d'apprentissage travaillant sur ce type d'exemples et capables de passer à l'échelle.