Le clustering est l’une des activités fondamentales en fouille de données. L’identification de groupes de données homogènes est une tâche importante, que ce soit pour la classification non-supervisée, la réduction de données ou la détection d’anomalies. Le clustering conceptuel fournit un aspect additionnel : la description des clusters par des concepts symboliques. Les approches classiques combinent la formation des clusters et des descriptions pour arriver à un compromis.
Ce poster présente une approche en deux étapes séparant la recherche des descriptions (extraction des motifs fermés) de la formation des clusters (modélisée et résolue à l’aide de la Programmation Linéaire en Nombres Entiers - PLNE). Notre approche a deux apports majeurs, directement liés à l’usage de la PLNE : exactitude et flexibilité. Les expérimentations menées montrent l’efficacité de notre approche pour traiter des problèmes de grande taille et fournir des clusterings de haute qualité.
Ce travail résulte d’une coopération entre l’équipe CoDaG du GREYC et le LITIO (Université d’Oran). Publication : Efficiently Finding Conceptual Clustering Models with Integer Linear Programming, [A. Ouali and al]. IJCAI, 2016.
Mots clés : fouille de données, programmation linéaire en nombres entiers, méthodes déclaratives et génériques, clustering et méthodes non supervisées, classification