Analyse de sentiments et compréhension des besoins clients : cas pratique

sept. 27, 2022

Les forums, les réseaux sociaux, les commentaires et même les réponses aux sondages sont de nos jours un moyen d’obtenir de précieuses informations sur les besoins et les avis des consommateurs.

Empreints d’ émotions et de sentiments , les retours textuels sur internet permettent de déterminer le niveau d’appréciation des utilisateurs. Qu’il soit positif, négatif ou neutre, il est toujours bon de le prendre en compte lorsque l’on veut investir une nouvelle part de marché ou conforter nos choix.


La grande valeur de ces données n’est souvent pas assez exploitée par les entreprises, elles représentent pourtant une mine d’or ! L’analyse de sentiments permet d’établir des
rapports précis , en un temps plus court qu’une étude de marché et en évitant toute partialité . De ce fait, on obtient rapidement un score et un verdict global, complet et cohérent.


Mais comment transformer ces données en informations significatives ? Voici quelques pistes et le
cas pratique d’une analyse de sentiments réalisée pour l’application Run Advisor, une application de running créée à Clermont-Ferrand. 


Analyse de sentiments : pourquoi opter pour cette solution 

Contrairement aux études de marché classiques qui ont essentiellement pour objectif d’atténuer les risques commerciaux et marketing pris par une entreprise, les études de Data Marketing ont pour objectif d’anticiper le comportement du marché face à de nouvelles propositions que pourrait formuler un acteur.

Ces études se basent sur une utilisation des données consommateurs et sur l’ automatisation de l’exploitation de ces dernières, raison pour laquelle on évoque souvent le terme d’études “ data driven ” (conduites par la donnée).


Afin de préparer l’analyse de sentiments chez Run Advisor il nous a d’abord fallu réaliser un
scraping puis une vectorisation .

Si nous voulons définir le scraping de façon simple nous pourrions dire que c’est le fait de pouvoir recopier, capter et télécharger le code source des sites internet et ainsi récupérer, dans ce code, le texte qui nous intéresse (comme les commentaires sur une page d’un réseau social ou les messages sur un forum).


Pour Run Advisor, les données captées représentent notre matière brute. Nous les récupérons sur un forum ayant pour thème des problématiques de running. Sur ce forum, le but est de récupérer uniquement le
texte des messages via le code source et la date pour ensuite consigner toutes ces informations dans un fichier structuré.


C’est ensuite qu’arrive le
deep learning et la partie vectorisation des mots. 

Cette étape consiste à ingérer l’ensemble des données afin d’obtenir un algorithme avec des scores de similarité . Ce score se situe entre 0 et 1, 0 représentant une similarité faible et 1 une forte similarité. Il nous permet de savoir si les sujets étudiés ont un fort intérêt pour les utilisateurs et s' ils représentent une opportunité de positionnement pour les entreprises. 


La vectorisation des mots (
word embedding en anglais) est une méthode d’ apprentissage automatique de représentation des mots. Chaque mot sera converti en un vecteur de nombres (en plusieurs dizaines de dimensions). Plus les vecteurs de deux mots seront proches, plus nous pourrons considérer qu’ils sont corrélés. Ce type de rapprochement permettra d’affiner le lien entre les deux mots étudiés (synonyme, lien hiérarchique, etc…). 

Dans l’exemple ci-dessus, nous pouvons remarquer que les couples de mots (<king>,<men>) et (<queen>,<woman>) sont semblables. 

L’algorithme de vectorisation des mots nous permettra de constater que si nous soustrayons au vecteur <king> le vecteur <men> puis lui additionnons <woman>, nous obtiendrons le vecteur <queen> : 

<king> - <man> + <woman> = <queen>


Cet exemple simpliste nous montre l’intérêt de la vectorisation des mots, qui nous permet ici de déduire le lien entre le mot King et le mot Queen .


Pour cette mission, l’algorithme utilisé était word2vec (lien arXiv, Mikolov et al.)

  • Procédé : L’algorithme convertit les mots en vecteur de nombres (réseaux de neurones)
  • Paramétrage : Cette étape permet de définir le calcul de  la fréquence minimale d’apparition pour qu’un mot soit pris en compte, les différentes dimensions prises en compte et la valeur seuil pour établir une proximité entre 2 mots…
  • Score de similarité : Pour déterminer ce score on utilise la similarité cosinus (cosinus entre les deux vecteurs). 


Une autre application est la recherche de proximité (similarité contextuelle) entre deux mots, pour retrouver notamment ce que les personnes assimilent le plus à un mot donné. 


Limites et avantages de l’analyse de sentiments

On n’y penserait pas directement mais une des principales limites et difficulté de l’analyse de sentiments réside dans les erreurs d’ orthographe et de syntaxe . Comme dans toute étude data driven , il faut bien prendre en compte le fait que la donnée se situe sur un forum et que ce type de fautes sont monnaie courante et elles sont à prendre en compte lors de la vectorisation .


Une des solutions pour pallier ce problème est la tokenisation . Cette technique consiste à remplacer un verbe sous toutes ses formes conjuguées par sa forme à l’infinitif. On nettoie et garde ainsi un contenu plus clair et digeste pour l’algorithme. 

Plus la donnée est mauvaise, plus ce travail sera compliqué et le résultat approximatif. 

 

Concernant les avantages, contrairement à une étude qualitative - pour laquelle on doit faire venir des personnes qui devront être rémunérées - une analyse de sentiments supprime les risques de biais dans les résultats. En effet, lors d’une étude data driven, on étudie des messages bruts issus d’un forum où les utilisateurs parlent librement. Comparativement, le coût d’une analyse de sentiments sera logiquement réduit par rapport à une étude de marché plus classique. 


Il n’y a d’ailleurs pas de secteur d’activité mieux qu’un autre pour effectuer une analyse de sentiments, ce n’est pas le secteur qui importe mais la donnée initiale, au-delà de sa qualité. 

Run Advisor : Objectifs et mission

Créée en 2021, Run Advisor est une application qui aide le coureur à dénicher des pépites et trouver les conseils dont ils ont besoin au quotidien pour se faciliter la vie dans leur pratique de la course à pied .

Aujourd'hui, l'application propose des milliers d' itinéraires , d' événements , de restaurants , d' hébergements mais aussi de chaussures et des magasins spécialisés adaptés aux coureurs. Ainsi, il compile toutes les informations clés pour tous les types de coureurs. L’application permet à chacun de trouver son bonheur que ce soit à proximité de son domicile où lors de ses déplacements. 

Run Advisor nous a sollicité pour mener une étude hybride entre l’ analyse de sentiments (centrée autour des commentaires et/ou critiques de consommateurs) et l’ analyse de tendances (centrée sur les réseaux sociaux).


L’étude devait être centrée sur des sujets précis :

  • Le choix des parcours de course
  • La recherche d’hébergement
  • La restauration
  • Le choix des chaussures
  • L’événementiel (les courses officielles)
  • La santé
  • Coureuses et sentiments négatifs


Impacts de l’analyse de sentiments 

Pour Mathieu Fillion, un des créateurs de l’application, l’intervention d’Agaetis a permis d’avoir une approche plus scientifique , pour lui “ cette approche plus statistique est rassurante et permet de s’appuyer sur des chiffres lors des levées de fonds. S’appuyer sur la data permet de mieux cerner les besoins des clients avec des valeurs basées sur des faits réels ”.


Pour toute l’équipe de Run Advisor, l’intervention a permis de confirmer qu’ils étaient bien en phase avec les besoins du marché mais également de prioriser leurs sujets. 

Dans sa globalité l’analyse allait dans notre sens ce qui nous a permis de conforter nos choix et de continuer d’avancer avec plus de certitudes sur notre positionnement et l’intérêt de notre solution .”

L’analyse de sentiments leur a d’ailleurs permis d’apporter des changements dans l’ UX ( user experience ou expérience utilisateur ) de l’application. Certaines catégories du site ont été mises plus en avant que d’autres en fonction des résultats pour mieux répondre aux besoins des utilisateurs. 


Aujourd’hui Run Advisor comptabilise plus de 15.000 téléchargements , 2.000 utilisateurs par mois, 3.500 événements et parcours , un large panel d’hébergements disponibles tout comme un large éventail de références de chaussures à la vente et 25 partenaires

L’ambition est d’atteindre plus de 100.000 utilisateurs et de continuer à favoriser l’ industrie locale auvergnate et française. 



Les utilisations de l’analyse de sentiments sont à la fois vastes et puissantes. La possibilité d’extraire des informations à partir des données disponibles sur internet pour mieux comprendre les attitudes des consommateurs et s'adapter est un outil très intéressant pour les entreprises à la recherche de réponses rapides et précises. 

Les indicateurs de performances traditionnels comme les vues, les partages, les clics, les likes ou les commentaires se concentrent sur le nombre. L’analyse de sentiments va au-delà de la quantité , car elle se concentre sur la qualité des interactions.

Ressources Agaetis

par David Walter 16 févr., 2024
OpenAI, a récemment dévoilé SORA, un outil de génération de vidéo. SORA monte encore une marche, offrant des capacités de génération de vidéos réalistes. Cet article explore les caractéristiques clés de SORA, son impact potentiel sur diverses industries, les points de réflexions et l'impact pour l'avenir de la création de contenu. Qu'est-ce que SORA ? SORA est une interface avancée conçue par OpenAI qui permet de générer des séquences vidéo à partir de descriptions textuelles simples. Utilisant des techniques de pointe en matière d'intelligence artificielle et d'apprentissage profond, SORA est capable de comprendre des commandes complexes et de les traduire en contenus visuels impressionnants. Une qualité de génération inégalée La capacité de SORA à générer des vidéos époustouflantes souligne un tournant dans le domaine de la production vidéo, où la qualité et la créativité ne sont plus entravées par des contraintes techniques ou financières. Cette avancée s'inscrit dans un contexte plus large où l'IA transforme profondément les industries créatives, offrant des outils puissants pour la transcription, le doublage, la création d'avatars générés par IA, et même la suppression de fonds vidéo, rendant ces processus plus accessibles et flexibles​​​​​​. Des outils comme Descript et Adobe Premiere Pro intègrent des fonctionnalités AI pour améliorer le processus d'édition vidéo, depuis la rotation des yeux jusqu'à la génération de transcriptions et sous-titres​​. De même, la comparaison entre DALL-E 3 et Midjourney montre comment l'IA peut capturer des détails et des ambiances spécifiques dans les images, un principe également applicable à la vidéo​​. La révolution du streaming vidéo illustre comment l'adaptation numérique bouleverse les modèles économiques traditionnels, offrant une perspective sur la manière dont les technologies génératives pourraient remodeler le paysage médiatique​​. L'impact de ces technologies dépasse la simple création de contenu ; elles remodèlent également notre compréhension de la créativité et ouvrent de nouvelles voies pour l'expression artistique et la communication. Avec des outils comme SORA, la barrière entre l'idée et sa réalisation se réduit, permettant à un plus grand nombre de personnes de donner vie à leurs visions créatives sans les contraintes traditionnelles de la production vidéo. Cet élan vers une qualité de génération inégalée par l'IA soulève des questions importantes sur l'avenir du contenu créatif et la manière dont nous valorisons l'interaction entre l'humain et la technologie dans le processus créatif. Alors que nous explorons ces nouvelles frontières, il est crucial de rester attentifs aux implications éthiques et aux défis que ces technologies posent, tout en reconnaissant leur potentiel pour enrichir notre monde visuel et narratif.
Airflow PostgreSQL MongoDB
par Ikram Zouaoui 07 févr., 2024
Integration de technologies pour optimiser les flux de travail : L'article met en lumière une approche combinée utilisant Airflow, PostgreSQL, et MongoDB pour améliorer l'efficacité des flux de travail liés aux données.
Show More
Share by: