Le rendez-vous de l’innovation

Les Partenaires
des Innovatives

Ministère de l'éducation nationale de l'enseignement supérieur et de la recherche ABG - L'intelli'agence Fist SA

Rechercher




Accueil > Éditions précédentes > Big Data > Innovatives Big Data > Espace Exposition - Posters > Traitement - visualisation des données

Square Predict : Défis scientifiques de la collecte à l’apprentissage scalable

par Benjamin LEVAUX - WEBMASTER FREELANCE - publié le , mis à jour le

Salima Benbernou - LIPADE, Université Paris Descartes, (+33)1.83.94.58.00, salima.benbernou chez parisdescartes.fr, http://www.mathinfo.univ-paris5.fr/~sbenbern/
Mustapha Lebbah - LIPN, CNRS UMR 7030, Université Paris 13, (+33)1.49.40.38.94, mustapha.lebbah chez univ-paris13.fr, https://sites.google.com/site/lebbah/

UMR CNRS 7030 LIPN, LIPADE

Les travaux qui seront présentés concernent la partie recherche du projet Square Predict. Square est un projet investissement d’avenir financé par la BPI -France où l’objectif était de développer une plateforme Big Data clé en main dédiée aux producteurs d’assurance afin de leur permettre de croiser, fusionner et d’exploiter l’avalanche de données locales et externes (ouvertes et/ou payantes). Ainsi pour cette journée nous nous focaliserons uniquement sur les résultats de recherche concernant la collecte et les modèles d’apprentissage statistique scalable.
Ces travaux seront illustrés sur un cas d’usage d’assurance.

La démonstration concernera :

  1. La fusion des données Big Data (open et propriétaires) : prochainement sur le https://github.com/SquarePredict/
  2. L’apprentissage scalable sur une plateforme dédiée à la recherche et l’enseignement. Une version de démonstration est en ligne https://github.com/Spark-clustering-notebook/coliseum
Square Predict : Défis scientifiques de la collecte à l’apprentissage scalable

Le projet Square Predict :
Square Predict est un projet mené avec plusieurs partenaires (ASTEK, DELTA METRIC, D&E) dont un géant de l’assurance (AXA), trois laboratoires de recherche (LIPN, LIPADE et LARIS), deux éditeurs et un expert en protection de la vie privée, a pour objectif de
bâtir une plateforme SaaS permettant aux assureurs de réaliser des prédictions à partir des données de leurs assurés croisées avec celles disponibles sur Internet (réseaux sociaux, web sémantique, open data…).

L’enjeu prévu dans le projet Square Predict est de développer une plateforme Big Data clé en main dédiée aux producteurs d’assurance afin de leur permettre de croiser, fusionner et d’exploiter l’avalanche de données locales et externes (ouvertes et/ou payantes). Ainsi pour ne pas se voir concurrencé dans la distribution de leurs produits, la plateforme industrielle a pour objectif de fournir des modèles d’apprentissage statistique et outils pour une meilleure personnalisation des produits permettant aux assureurs de réaliser des visualisation et prédictions à partir des données de leurs assurés croisées avec celles disponibles sur le web (réseaux sociaux, open data…). Ainsi la plateforme Square Predict permettra aux assurances de valoriser et monétiser le patrimoine de données qu’elles ont accumulées depuis des années, et donnera un avantage concurrentiel sans égal tout en respectant la vie privée des personnes.

Références

  • Mohammed Ghesmoune, Mustapha Lebbah, and Hanane Azzag. A new growing neural gas for clustering data streams. Neural Networks, Special Issue on Neural Network Learning in Big Data, 2016. Volume 78, June 2016, Pages 36–50. http://dx.doi.org/10.1016/j.neunet.2016.02.003
  • Tarn Duong ; Gael Beck ; Hanene Azzag ; Mustapha Lebbah. Nearest neighbour estimators of density derivatives, with application to mean shift clustering. Pattern Recognition Letters (Under publication)
  • Salima Benbernou, Xin Huang, Mourad Ouziri. Fusion of Big RDF Data : A Semantic Entity Resolution and Query Rewriting-Based Inference Approach. WISE (2) 2015 : 300-307
  • Mohammed Ghesmoune, Hanene Azzag, Salima Benbernou, Tarn Duong, Mustapha Lebbah, and Mourad Ouziri. Big data : A story from collection to visualization. Machine Learning. Special issue "Discovery Science", Under Submission.

Participants au projet

  • Hanane Azzag, LIPN, CNRS UMR 7030, Université Paris 13
  • Mourad Ouziri, LIPADE, (LIPADE, Université Paris Descartes),
  • Soror Sahri, LIPADE, (LIPADE, Université Paris Descartes),

Personnels en CDD
LIPN

  • Mohammed Ghesmoune (Doctorant)
  • Tugdual Sarazin (Doctorant)
  • Gael Beck (Doctorant)
  • Tarn Duong (Post-doc)

LIPADE

  • Xin Huang (Doctorant)
  • Mehdi Bentounsi (Post-doc)
  • Christophe Rodrigues Bento (Post-doc)
Téléchargez le poster

Partenaires Innovatives Big Data

EDF Thalès Cap Digital

Avec le soutien du GDR

Madics