Le projet de recherche PCU a pour objectif d’optimiser les performances d’un moteur de recherche destiné à des sites d’e-commerce conçus avec le logiciel open-source Magento. Il illustre les enjeux de la recherche partenariale du De Vinci Research Center.
Le projet PCU (Plateforme de Connaissances Unifiées) mobilise un budget de 3,5 millions d’euros alloué par la BPI et la Région Île-de-France dans le cadre de l’appel à projets du Pôle Systematic Paris-Region.
Coup de boost pour un moteur de recherche Magento
Smile, leader européen de solution open-source propose la solution de moteur de recherche Magento Elastic Suite. Cet add-on a pour objectif de combler les lacunes du moteur de recherche proposé par défaut avec Magento, logiciel open-source de référence dans le domaine de l’e-commerce.
70% des internautes utilisent un moteur de recherche en visitant un site internet, 30% quittent le site après l’avoir utilisé, et 40% tentent d’affiner ou de corriger leur recherche : la recherche est un enjeu central dans les problématiques e-commerce.
Déjà adopté par plusieurs entreprises, Magento Elastic Suite doit évoluer, devenir plus sophistiqué, car les consommateurs sont de plus en plus exigeants… et la concurrence est rude dans le monde du Big Data. Pour s’adapter et garder son agilité, Smile a donc fait appel, entre autres, à des enseignants-chercheurs. Cette façon de procéder se nomme la recherche partenariale.
« L’idée, c’est de mieux prédire les comportements individuels de chaque visiteur à partir de ceux des autres », explique Marie Haikel-Elsabeh, enseignant-chercheur et partie prenante du projet. « Aujourd’hui, on travaille sur toutes les données disponibles, reprend-elle. On ne fait que tester et retravailler. On part d’avis de consommateurs autant quantitatifs que qualitatifs. »
Alors que la solution Magento Elastic Suite se basait uniquement sur le catalogue des produits des sites de commerce en ligne, la PCU permet une plus grande synergie entre des données de différentes natures (traces d’usages ou « logs », avis de consommateurs sur les produits, parcours sur le site, etc.).
Les données, le nerf de la guerre
Avec le RGPD et l’anonymisation des données, les contraintes sont de plus en plus nombreuses pour les chercheurs qui travaillent sur la PCU.
« C’est le plus gros challenge : trouver des data. Les bases dont nous disposons sont partielles. Difficile d’avoir une prédiction aussi précise que celle d’un moteur de recherche comme Netflix qui combine plusieurs types de recherches en même temps », souligne Marie Haikel-Elsabeh.
Aujourd’hui, l’équipe est en quête de nouveaux jeux de données pour améliorer encore ses prédictions.
Les autres partenaires du projet
Pour Smile, Armadillo met en place des solutions techniques implémentables à partir du travail des enseignants-chercheurs. L’entreprise est spécialisée dans la gestion de contenu et l’urbanisation de Système d’Information.
La Business Unit Wallix est spécialisée dans le déploiement et l’hébergement d’applications critiques. Depuis 2015, elle a démarré deux projets clients de collecte et de recherche de données basés sur la technologie Qwazr.
Aux côtés du Pôle De Vinci, le LIPN (Laboratoire d’Informatique de Paris-Nord) est spécialisé dans la fouille de données massives et l’apprentissage, le traitement du langage naturel, l’Ingénierie des Connaissances et l’accès à l’information.
Le projet PCU doit durer jusqu’en 2020.
Retrouvez toute l’actualité du De Vinci Research Center et les détails du projet PCU.