Accélérer le time-to-market

Remplir automatiquement les attributs grâce à l'Extraction

DATE : 05/05/2022
25/8/2022

C'est l'une des tâches voire la tâche la plus chronophage lorsque l'on s'intéresse à l'onboarding de catalogues fournisseurs : remplir les attributs de chaque produit ! C'est simple, tout e-commerçant qui souhaite maximiser son panier moyen et minimiser son taux d'abandon de panier veut que ses clients puissent au minimum filtrer les produits en fonction de leur couleur, de leur taille ou autre.

Non seulement il faut remplir les attributs mais il faut également s'assurer qu'il n'y ait pas d'erreurs tout en remplissant les attributs le plus vite possible afin de réduire son time-to-market et capturer des parts du marché plus rapidement que vos concurrents.

Le module d'extraction d’Unifai permet de compléter ces attributs de façon automatisée grâce à l'Intelligence Artificielle.


Module d'extraction, kézako ?

Le module d'extraction sert à enrichir les attributs à partir des libellés et des descriptions. Autrement dit, l’IA va chercher dans les titres et les descriptions de la donnée produits les attributs attendus.

Si les informations sont présentes, l’algorithme va pouvoir enrichir tous types d'attributs. Des plus basiques, comme la marque, les dimensions, le poids, la couleur, le diamètre, etc., aux plus complexes et rares (la vitesse du vent en sortie de souffleuse, la dimension du mandrin...).

exemple extraction unifai
Le module d'extraction - D'autres informations telles que le nombre de positions ou l'indice de résistance auraient pu être extraits.

Le secret derrière l'enrichissement automatisé

Nous n'allons évidemment pas vous révéler la recette de notre technologie dans cet article. Néanmoins, nous pouvons vous en dire plus sur son fonctionnement.

Contrairement à la catégorisation, dont nous parlons ici, ce n'est pas du NLP (Natural Language Processing) mais du NLU (Natural Language Understanding). C'est globalement la même chose, la façon d'entraîner l'algorithme est différente. Mais pourquoi le NLU ?

Dans le langage naturel, ce qui est exprimé (par la parole ou le texte) n'est pas toujours ce qui est voulu. Prenons une phrase d'exemple :

Cet artiste a mis le feu sur scène, c'était génial !

Le NLP se concentre sur le traitement du texte dans un sens littéral, il considérera qu'il y a vraiment du feu sur scène. À l'inverse, le NLU se concentre sur l'extraction du contexte et de l'intention, ou en d'autres termes, sur ce qui a été dit.

Dès lors, le NLP peut traiter le texte du point de vue de la grammaire, de la structure, des fautes de frappe et des points de vue, mais c'est le NLU qui aidera la machine à déduire l'intention derrière le texte. Ainsi, même s'il existe de nombreux chevauchements entre le NLP et le NLU, cette différenciation les distingue nettement.

Ainsi, nous pré-entraînons un modèle d’analyse de texte pour lire et comprendre le nom des produits et leur descriptif. Le modèle est entraîné à détecter 3 choses :

  • Les contradictions
  • Les chaînes de caractères neutres
  • Les implications sémantiques (Exemple : Elle va tous les jours au travail à vélo - ça implique qu'elle sait faire du vélo et qu'elle va tous les jours au bureau)


L'Intelligence Artificielle a donc besoin de 2 entrées : un contexte (une description, un titre) et une question (Query).

Dans le cas d’un traitement de la donnée de nos clients, le contexte correspond à toutes les informations que l'on a sur le produit. À savoir son titre, sa description voire quelques attributs ou sa place dans la nomenclature du fournisseur. Nous ne vous apprenons rien, la quantité d'informations à disposition est très variable en fonction du fournisseur.

Ensuite, nous demandons à l'algorithme de tirer de ce contexte une donnée qui nous intéresse.

Par exemple : Quelle est la vitesse de sortie de cette souffleuse ? (pour remplir l’attribut : vitesse de sortie)

À savoir qu’il est nécessaire d’avoir préalablement défini une nomenclature (la liste des attributs à extraire) et la nature des attributs. S’il s’agit d’un attribut numérique, il faut également définir la valeur minimale et maximale, s’il s’agit d’une liste (comme une liste de couleurs), les options possibles doivent avoir été listées.

Cela pour une raison simple : un attribut de même nature peut avoir des caractéristiques différentes. La longueur maximale d'un meuble est différente de celle d'une assiette.

La force des algorithmes d’Unifai est dans leur capacité à travailler sur toutes les données de produits, peu importe la quantité ou leur niveau de complexité. 

Par exemple, nous travaillons avec Warmango.fr, pour qui il n’est pas rare d’avoir des produits avec plus de 40 attributs. Léa Pounot, Database Manager chez Warmango.fr indique qu’aujourd’hui, “toutes les tâches manuelles et répétitives ont pu être facilement automatisées, ce qui représente un gain de ressources qui impacte l'ensemble des services de Warmango.fr. Cela se traduit par un gain de temps lors du référencement, ce qui permet d'avoir des contenus plus précis et plus pointus. Ainsi, les problématiques de SAV sont réduites voire évitées, et le tunnel d'achat est simplifié.” 

Si vous souhaitez en savoir plus, n’hésitez pas à télécharger nos cas clients dont celui de Warmango ou nous contacter directement.

Evan Barbier

Derniers articles

25/1/2023
-
Marketplace
Mauvaise gestion des données produits : quels impacts pour une Marketplace ?
Une mauvaise gestion des données produits induit des impacts sur l’image d’une marketplace. Découvrez vite comment y remédier et optimiser vos ventes.
> Lire la suite
24/1/2023
-
Fiabilisation des données
Distributeur BTP : Industrialisez vos mises à jour tarifaires
Ce n’est un secret pour personne à présent, la filière du BTP est principalement impactée par l’inflation et la hausse des prix mais pourquoi les négoces sont les 1ers concernés ? Découvrez notre solution pour mettre à jour vos tarifs simplement depuis Unifai.
> Lire la suite