RICM5
Introduction à la Science des Données
TP 1 - Perceptron & Adaline

1. But du TP

L'objet du TP est de comparer les modèles de classification de Perceptron et de Adaline sur quelques jeux de données de UCI. Les pas d'apprentissage de ces modèles doivent &ecric;tre estimés par validation croisée.

2. Déroulement

  1. Télécharger les bases suivantes :
  2. Prétraiter ces bases de façon à avoir, pour chaque ligne, la classe de l'exemple associé en premier attribut (-1, +1) et puis ses caractéristiques normalisées.
  3. Les tailles des bases d'apprentissage et de test qui seront choisies dans la suite doivent correspondre à une proportion 60%/40% de la base initiale
  4. Coder l'algorithme du perceptron avec le langage de votre choix et estimer le pas d'apprentissage par validation croisée en choisissant ses valeurs parmi {1e-5, 1e-4, 1e-3, 1e-2, 1e-1}.
  5. Programmer le modèle Adaline en vous inspirant de celui de Perceptron et choisir le pas d'apprentissage par validation croisée en choisissant ses valeurs parmi {1e-5, 1e-4, 1e-3, 1e-2, 1e-1}.
  6. Comparer les performances de ces deux modèles sur les bases de UCI en répétant chaque expérience 20 fois, en créant un tableau récapitulatif reportant les moyennes des erreurs de test.
Le pseudo-code pour tester un modèle est ainsi le suivant:

Pour t=(1..20)
   - Scinder la collection prétraitée suivant deux bases d'apprentissage  (3/4 de la collection) et de test (1/4 de la collection) 
   Pour 
      Pour K= 1..5
         - Construire une base d'entraînement (4/5)  et une base de validation (1/5) , à partir de la base d'apprentissage  
           avec un tirage aléatoire sans remise;
         - Apprendre le modèle sur la base d'entraînement  avec le pas d'apprentissage ;
         - Estimer l'erreur  sur la base de validation ;
      Fin Pour
      - Calculer l'erreur moyenne correspondant au pas d'apprentissage : 
             
   Fin Pour
   - Choisir le pas  pour lequel l'erreur  est la meilleure;
   - Apprendre le modèle sur la base d'apprentissage  avec le pas  choisi précédemment;
   - Estimer l'erreur  sur la base test 
Fin Pour
- L'erreur du modèle se calcule alors comme:
      .