Le rendez-vous de l’innovation

Les Partenaires
des Innovatives

Ministère de l'éducation nationale de l'enseignement supérieur et de la recherche ABG - L'intelli'agence Fist SA

Rechercher




Accueil > Éditions précédentes > Big Data > Innovatives Big Data > Espace Exposition - Posters > Valeurs des données

Clustering conceptuel en Programmation Linéaire en Nombres Entiers

par Benjamin LEVAUX - WEBMASTER FREELANCE - publié le , mis à jour le

Membres de l’équipe « COnstraints, Data mining and Graphs » (CoDaG)
Contact : Samir Loudni, samir.loudni chez unicaen.fr
GREYC CNRS UMR 6072 (Groupe de REcherche en Informatique, Image, Automatique et Instrumentation de Caen), Normandie Univ, UNICAEN, ENSICAEN, 14000 Caen, France

Clustering conceptuel en Programmation Linéaire en Nombres Entiers

Le clustering est l’une des activités fondamentales en fouille de données. L’identification de groupes de données homogènes est une tâche importante, que ce soit pour la classification non-supervisée, la réduction de données ou la détection d’anomalies. Le clustering conceptuel fournit un aspect additionnel : la description des clusters par des concepts symboliques. Les approches classiques combinent la formation des clusters et des descriptions pour arriver à un compromis.

Ce poster présente une approche en deux étapes séparant la recherche des descriptions (extraction des motifs fermés) de la formation des clusters (modélisée et résolue à l’aide de la Programmation Linéaire en Nombres Entiers - PLNE). Notre approche a deux apports majeurs, directement liés à l’usage de la PLNE : exactitude et flexibilité. Les expérimentations menées montrent l’efficacité de notre approche pour traiter des problèmes de grande taille et fournir des clusterings de haute qualité.

Ce travail résulte d’une coopération entre l’équipe CoDaG du GREYC et le LITIO (Université d’Oran). Publication : Efficiently Finding Conceptual Clustering Models with Integer Linear Programming, [A. Ouali and al]. IJCAI, 2016.

Mots clés : fouille de données, programmation linéaire en nombres entiers, méthodes déclaratives et génériques, clustering et méthodes non supervisées, classification

Téléchargez le poster