Groupes de recherche

| S3 | IC2 | RMS | MIC2 |

Catégories

Archives

Se connecter



Pages spéciales

2010/02/11 – séminaire du Bilab: “La visualisation multidimensionnelle pour l’analyse exploratoire de données”

11 février 2010
15:00au17:00

Séminaire Bilab “Business Intelligence” (informatique décisionnelle):
Télécom ParisTech, 46 rue Barrault, Paris 13ème, de 15h à 17h, en salle B316.

Sujet : La visualisation multidimensionnelle pour l’analyse exploratoire de données

Présenté par : Michaël Aupetit & Sylvain Lespinats (CEA : LIST “Laboratoire Intelligence Multi-capteurs et Apprentissage”)

Résumé : Dans de nombreux cas, les données que l’on veut comprendre peuvent se représenter comme un nuage de points dans un espace multidimensionnel.
Lorsque ces données sont représentées dans le plan, la visualisation est un moyen efficace d’extraire des informations de nature statistique, géométrique et topologique. Lorsque les données ne se représentent pas naturellement dans le plan, il existe deux voies d’analyse possibles.
D’une part, les méthodes de projection dans le plan et d’autre part, les méthodes d’analyse in situ dans l’espace multidimensionnel. Toutes deux posent le problème de l’intelligibilité de la représentation ainsi construite.

La première partie de cet exposé est dédiée aux méthodes de projection.
Nous présenterons quelques méthodes (linéaires et non-linéaires) classiques et moins classiques. En particulier, nous introduirons la méthode DD-HDS (Data-Driven High Dimensional Scaling) qui se fixe pour objectif la préservation des distances entre données, et la méthode RankVisu? qui se focalise sur la préservation des rangs de voisinage.
Enfin, nous évoquerons Classimap qui tient compte d’informations additionnelles (comme l’appartenance à des classes) pour la projection.

Dans la seconde partie, nous présenterons le paradigme de la visualisation multidimensionnelle in situ, qui définit un cadre dans lequel les projections planes de données multidimensionnelles sont interprétables. Nous montrerons que les méthodes de projection non-linéaires (type ISOMAP, MDS, Sammon, LLE, KPCA, SOM…) telles qu’elles sont habituellement employées ne sont en général pas utilisables pour inférer sans erreur des propriétés des données originelles. Nous montrerons comment replacer ces méthodes dans le cadre in situ pour leur rendre tout l’intérêt qu’elles méritent.
Plusieurs exemples sur des données de grande dimension seront présentés, et nous discuterons des problèmes ouverts dans ce domaine.

Pour plus d’informations, rendez vous sur le site Internet du Bilab, à l’adresse suivante : http://bilab.enst.fr/

Commentaires clos.