Allez chercher 20% avec vos données textuelles!

Artificial Intelligence
Knowledge management
NLP
May 18, 2020 - 9 min read

Theobald Le louarn

Founder @Cobbaï
Quel est le point commun entre une usine de construction de rétroviseur et un site de production de sucre blanc ? 

Des produits qui se ressemblent ? Pas du tout !
Des machines similaires ? Perdu !
Des processus identiques ? Rien à voir !
Les mêmes clients ? Clairement pas!

Mais alors c’est quoi ?

Le point commun c’est la quantité astronomique de donnée textuelle générée mais non-valorisée. 

En bref, les industriels, tous secteurs d’activité confondus génèrent énormément de texte. Ils les stockent dans leurs archives ou dans des bases de données et puis… et puis rien !

Dans cette chronique nous aborderons les sujets suivants : 
  • Qu’est ce que la donnée textuelle?
  • Pourquoi la valoriser ?
  • Comment faire en pratique ?


Qu’est-ce que la donnée textuelle ?


En préambule rappelons qu’il est possible de distinguer deux grandes familles de données : 
  • les structurées
  • les non-structurées qui sont un vrai casse-tête à exploiter

Les données structurées kesako ?

Ce sont les données chiffrées (ex: données d’une machine). Bref toutes ces données quantitatives qui s'interprètent facilement par l’ordinateur ou l’humain pour réaliser des analyses (courbes, graphe, statistiques, prévisions, détections d’anomalies, identification de corrélations..)

Les bases de données de nos ERPs sont pour la plupart remplies par ces données structurées que vous adorez extraire pour faire des analyses.

Mais parfois on tombe sur des données un peu moins sympa à exploiter: les non-structurées.

Quelques exemples : 
  • les images ou vidéos
  • les fichiers audio
  • les textes (réclamations clients, commentaires sur les réseaux sociaux, déclarations de non-qualité ou de pannes, compte-rendu de maintenance…)

Les données textuelles nous intéressent particulièrement car pour l’instant rares sont les entreprises qui en exploitent le plein potentiel. Et pourtant elles font partie de notre quotidien. Car dès que l’on s’exprime à l’oral ou à l’écrit nous générons du texte.

Quelques exemples de données textuelles:

Les entreprises regorgent de données textuelles


Alors pourquoi les données textuelles sont-elles si compliquées à exploiter et à valoriser ?
  • le choix des mots dépends de celui qui écrit
  • il peut y avoir des niveaux de langue différents (fautes d'orthographes, tournures de phrases…)
  • Il peut y avoir des langues différentes (pour les entreprises internationales)

Bref, même si la conjugaison et la grammaire nous permettent de nous comprendre ça ne suffit pas à structurer la donnée. Prenez un français, un italien et un chinois. Demandez leur de décrire une panne machine. Vous aurez trois textes différents ! 



Pourquoi la valoriser ?

Pourquoi génère-t-on autant de données textuelles?

A chaque fois qu’il se passe quelque chose on a tendance à le noter. Pour ne pas l’oublier. Pour s’en rappeler plus tard. Pour se justifier. Pour le transmettre à un collègue.  Le fait est que l’on écrit tout ce qui se passe et se déroule dans l’entreprise (non-conformités, retour d’expériences, rapport de réunion, panne d’une machine, réclamation d’un client…).

On imagine bien que certaines informations sont très contextuelles et n’ont pas pour vocation à être stockées. Mais le reste est une mine d’or. En effet, tous les problèmes de l’entreprises et toutes leurs solutions ont été dûment renseignés. 

Se cache donc derrière nos milliers de rapports une quantité phénoménale de diagnostics et autant de remèdes potentiels.

Pour faire simple, tous ces textes renferment le savoir-faire de l’entreprise. Alors pourquoi ne pas s’en servir pour construire une grande mémoire collective que l’on pourrait analyser et solliciter?

la mémoire collective


Quels sont donc les deux intérêts majeurs à valoriser la donnée textuelle et capitaliser le savoir faire ? (des arguments pour nous aider à convaincre notre direction, nos équipes et nos associés)

[1er argument | Permettre de prioriser en analysant la mémoire collective] 

“Un des problèmes avec la donnée non structurée c’est la quantité.” 

Lorsque l’on doit lire deux ou trois phrases c’est assez rapide. Maintenant si on vous demande d’identifier quels sont les problèmes les plus récurrents sur notre chaîne de production et que je vous donnes les 12 000 déclarations de non-conformités de l’année dernière, c’est une autre paire de manches. Comment prioriser des chantiers d’améliorations continue dans une usine ?  Quels thématiques récurrentes soulevées par mes clients ? Quels problèmes reviennent le plus chez mes fournisseurs ? Toutes ces informations sont diluées parmis les milliers de données textuelles stockées dans nos serveurs ou dans nos armoires.
Et pourtant, si on arrive à les valoriser, on est capable de mieux comprendre les attentes de nos clients, de trouver les failles qui impactent le plus nos processus. Bref on est capable de prioriser nos efforts pour améliorer notre offre, notre service ou notre produit.


[2ème argument | Accélérer la résolution de problème grâce à la mémoire collective]

“Je passe mon temps à réinventer la roue”

80% de l’information dont on a besoin au quotidien est déjà stockée (dans nos mails, notre base de donnée ou nos fichiers excels). Pourtant, quand on veut trouver la bonne information il nous faut naviguer dans des dizaines de fichiers, faire des requêtes incompréhensibles ou en dernier recours croiser les doigts pour que le collègue qui possède l’information ne soit pas en congés. 
Bref, il faut fournir un véritable effort pour trouver la bonne information. Le hic c’est que le temps et les ressources sont limités. Aussi, quand je suis dans l’urgence parce que mon client a acheté une voiture défectueuse ou parce que le ballon d’eau chaude d’une famille de 5 enfants ne fonctionne plus, je n’ai pas le luxe de pouvoir réinventer la roue. Il me faut des résultats et rapidement. 
Trouver un moyen de valoriser et d’accéder à mon savoir-faire en temps réel me permet de résoudre mes problèmes plus vite quotidien et donc d’améliorer ma productivité. 

C’est bien beau tout ça mais comment réussir à analyser des milliers de données non structurées pour identifier les priorités et la bonne information ? Comment bien construire son savoir-faire ? 



Comment la valoriser ?


Il y a plusieurs ingrédients pour pouvoir tirer le maximum des données textuelles.

La qualité de la donnée !
S’il est vrai que la donnée textuelle est bien trop sous-exploitée c’est aussi parce que souvent les données ne sont pas facilement exploitables. 
La qualité de la donnée est primordiale. Mais qu’est ce que ça veut dire ? 
Le contenu de l’information est-il homogène au sein de mes données. Les informations dans les rapports sont elles fiables et renseignées selon des modes opératoires structurés ? Quelles données sont comparables ? Qui renseigne l’information ?
Beaucoup de questions pour améliorer la qualité de votre donnée et vous assurez que vous capitalisez la bonne information. Et vous vous en êtes où?


Le stockage intelligent de la donnée !
Fini la période des excels et words à gogo. Fini de se la jouer perso avec ses propres templates! Equipez vous du bon outil pour qu’à chaque étapes de vos processus vous puissiez stocker la donnée utile et exploitable. Bref, optez pour une mémoire sélective et agile qui organise ses neurones en fonctions de vos besoins.

la puissance de l'IA textuelle


La compréhension du texte par la machine !
Maintenant que mes données sont robustes et que je stocke la bonne information, il serait temps de comprendre ce qu’elles recèle afin de construire cette mémoire collective. Le problème c’est que la machine ne comprend pas le langage humain, elle ne parle que en 1 et en 0. Bloqué?
Pas du tout, l’intelligence artificielle spécialisée dans l’analyse du langage (NLP ou TAL pour les francophiles) vient à notre rescousse. En choisissant les bons modèles d’IA (parce qu’il y en a des tonnes) on peut s’assurer que l’ordinateur comprenne le langage humain. Si vous vous voulez en savoir plus, nous avons écrit d’autres chroniques (ici)

L’analyse de la donnée
C’est bien beau mais opérationnellement, comment j’en tire des gains ? Que fait-on une fois que nous avons construit cette mémoire collective ? 

On peut tirer beaucoup de chose d’un savoir faire. En analysant les non-conformités et leurs résolutions on peut identifier les sujets récurrents qui impactent le plus une ligne de production. Grâce aux feedback clients on peut mesurer la satisfaction et prioriser les plans d’améliorations d’un services ou d’un produit. Mais ça ne s’arrête pas là, en analysant les problèmes et les compétences présentes dans l’entreprise on peut identifier les expertises en tension dans l’entreprise. 

Tout cela n’est possible qu’avec les bons outils de visualisations. Pas question d’utiliser Excel pour trier des milliers de ligne de texte. Chez Cobbaï, nous avons développé une technologie qui permet justement de comprendre vos données textuelles en un clin d’oeil. Ce n’est pas tout. Pour obtenir une réalité opérationnelle et pouvoir passer de la prise d’information à l’action, il est conseillé de choisir un outil capable de s’adapter à vos besoins et à vos processus. Bref, une solution digitale qui connaît les contraintes de votre secteur.

L’accès rapide à la donnée
L’un des problèmes majeurs avec SAP, c’est qu’il faut être ceintures noires de l’outil pour trouver la bonne information. Peu de collaborateurs possèdent cette maîtrise et donc rares sont ceux qui vont chercher à utiliser la mémoire de l’entreprise. Chacun va choisir de capitaliser sur son propre word ou son tableur excel. 
Bref, personne n’entretient et n’utilise la mémoire collective car il est trop difficile d'interagir avec elle. 
Fort heureusement, les nouvelles technologies et les nouveaux supports informatiques (smarphone, tablette etc..) ouvrent de nouvelles perspectives. Il est désormais possible d'interroger et d’alimenter facilement la mémoire collective depuis une ligne de production ou un domicile client. En effet, les assistants virtuels (aka chatbots) nous rendent la vie facile. Il suffit de converser avec eux et ils se chargent de piocher ou rajouter les informations pertinentes dans la mémoire collective. 

la mémoire collective : un avantage concurrentiel incroyable


Alors convaincu(e) que la donnée textuelle est un axe de compétitivité à ne pas négliger? N’ayons plus peur d’écrire, d’expliquer et de capitaliser. Au contraire c’est possible d’en faire une force! 

Et si vous pouviez convertir vos milliers de textes et rapports en profit ! Intéressé(e)?

By submitting your email, you accept to receive our last blog's articles by email and you take note of our privacy policy

At any moment, you can unsubscribe thanks to unsubscribe links or by contacting us at [email protected]

Contact

Copyright 2019 - 2020 Cobbai. All rights reserved