
Dans les coulisses de l’écriture et de l’IA
02 mai 2018À la une, Sobriété éditorialeAutomatiser la production de l’écrit grâce à l’intelligence artificielle : un joli fantasme abondamment nourri depuis quelques années. En réalité, quels sont les apports de l‘intelligence artificielle pour produire ses contenus ? Est-il urgent de reconsidérer nos métiers, puisque aujourd’hui des robots sont capables de produire des textes ?
J’ai évoqué ce sujet dans mon livre La puissance de l’éditorial : boostez votre business.
Pour aller plus loin, j’ai interrogé Henri Sanson qui dirige la recherche en intelligence artificielle au sein d’Orange.
Consultez son interview
Écriture et IA : la parole à Henri Sanson
En préambule, je précise que le domaine dans lequel j’évolue concerne
- L’intelligence artificielle et le fait de reproduire les capacités cognitives des humains, telles que le langage naturel et la conversation,
- L’intelligence décisionnelle qui comprend le pilotage des systèmes pour réaliser des actions que ne ferait pas un être humain, et visant une certaine optimalité.
1. Comment les bots arrivent à comprendre le langage naturel ?
La compréhension du langage naturel intervient dans 2 champs :
- La compréhension des textes écrits
- Les aspects conversationnels
En ce qui concerne la compréhension des textes écrits, il s’agit d’extraire la connaissance présente dans les documents sous une forme exploitable par les machines, pour permettre des processus de raisonnement par exemple.
En ce qui concerne l’analyse conversationnelle, la compréhension des conversations est plus ou moins avancée.
En général, les énoncés des demandes utilisateurs sont plus simples que ce qu’on trouve dans les documents écrits. Comprendre le langage naturel nécessite dans ce cas de déterminer à quelles questions ou demandes le système est supposé répondre et comment. On parle d’intention utilisateur : l’agent artificiel doit aussi avoir une intention de réponse. Comment fabriquer cette intention de réponse, comment la choisir pour générer la réponse ?
Un humain puise dans un champ quasi infini de connaissances, et il peut répondre à une question ou à côté. Ce cœur d’intelligence est très complexe à reproduire dans les systèmes conversationnels.
Aujourd’hui, en industrie, ce qui existe est simple. Tandis qu’en recherche, nous essayons de rendre ce système de fabrication de réponse à la volée plus automatique.
Il est par ailleurs possible d’écrire un texte automatiquement à partir de données factuelles extraites d’une base de données. En revanche, ce que nous ne savons pas faire, c’est générer un texte qui véhicule des idées, elles-mêmes générées par une IA.
2. Comment se passe la compréhension de la phrase et comment arriver à comprendre l’intention de l’utilisateur ?
La compréhension de la phrase représente un gros enjeu.
Considérons d’abord ce qui est fait dans les bots/agents conversationnels.
En bref, le concepteur de bots définit manuellement la liste des intentions prises en charge. Les designers proposent plusieurs formes d’énoncés, qui doivent correspondre au mieux aux vraies formulations des utilisateurs.
Par exemple : ‘je suis client, j’ai bloqué mon mobile’ ou ‘je souhaite des infos sur les offres fibres.’
L’énoncé de l’utilisateur mélange un aspect à la fois pragmatique et sémantique, pourvu d’une intention et d’un sens.
Le système choisit parmi les différentes intentions supportées pour proposer une réponse.
Il est également capable de reconnaître les éléments variables, qui vont venir préciser la demande de l’utilisateur, comme des horaires de train.
S’il manque des informations dans l’énoncé utilisateur, le système va les demander successivement à l’utilisateur de sorte à produire une demande sous forme structurée : horaires/train/jour ce qui finalement va correspondre à un système de questions/réponses.
Les résultats sont combinés et le système construit la réponse.
Il existe des requêtes logiques encore plus complexes à mettre en œuvre, qui nécessitent de combiner plusieurs requêtes logiques plus élémentaires, mais imbriquées pour arriver à la réponse. Permettre leur expression en langage naturel exige une compréhension plus poussée de ce langage, faisant appel à des approches compliquées à expliquer.
Par exemple, l’énoncé ‘Je veux aller voir Michel’ est complexe, car aller voir = rendre visite et pas aller+voir.
C’est cette tendance qui monte en puissance au niveau de la recherche, chez tous les acteurs comme Google, Facebook.
D’autres approches permettent d’appliquer un raisonnement directement sur le langage naturel.
Pour l‘instant, elles sont à l’état embryonnaire, et ne fonctionnent que sur des successions d’énoncés simples.
3. Comment se passe la construction du dialogue ?
Par dialogue, il faut entendre une succession d’interactions en langage naturel, dont la clé est le choix puis la génération de réponses par l’agent conversationnel artificiel. Elles sont constituées de phrases à trous avec des arguments variables, qui se basent sur la structure syntaxico-sémantique de la phrase.
Le choix des réponses se fait en fonction des conditions : à quel état de mon dialogue j’en suis et en fonction des infos supplémentaires à préciser : ‘précisez-moi votre demande’.
Ainsi, le chatbot lance également des commandes informatiques, il ne fait pas que répondre au langage naturel.
Plusieurs travaux en cours concernent la génération des paraphrases pour rendre moins monotone l’interaction avec le chatbot.
4. Pensez-vous qu’un texte puisse totalement être écrit par un robot ?
Certains textes peuvent être écrits de manière automatique.
Par exemple, les résultats d’un match de foot. La rédaction d’un tel texte consiste à synthétiser des informations issues de bases de données. Il s’agit de structurer des connaissances et de mettre en forme en suivant des règles simples et des phrases à trous : telle variable vaut tant. Tel joueur a marqué tant de points.
C’est ainsi qu’on transforme une information structurée en langage naturel.
Le plus complexe est de choisir, voire de générer des infos. Car effectivement, la première étape avant de s’exprimer sur un sujet consiste à déterminer les infos que l’on souhaite faire passer. Comment les mettre en forme avec subtilité ?
5. Peut-on mettre de l’émotionnel avec l’IA?
C’est une dimension d‘analyse linguistique et de reconnaissance d’une tonalité en termes d’émotion dans un énoncé qui est concernée.
Plusieurs techniques coexistent. Les plus basiques, mais néanmoins efficaces, étiquettent des énoncés types liés à des tonalités : colère, désir, empathie, joie, ce qui permet d’entraîner une machine apprenante sur de tels corpus étiquetés pour qu’elle généralise ensuite cette capacité à reconnaître ces tonalités..
Ces approches sont très ingénieriques. Aujourd’hui, la recherche porte sur la compréhension et la production de réponses, sur l’efficacité du lien entre question et réponse plus que sur la prise en compte de la tonalité émotionnelle de l’énoncé utilisateur. Nous n’avons pas de recul sur l’usage.
Et demain ? Nous commençons à travailler sur la génération de langage. L’émotion est encore difficile à appréhender en termes techniques. Les tests d’usage et les impacts utilisateur font partie de nos sujets de recherche. Par exemple, nous travaillons sur la maison sensible, une maison intelligente capable de capter ce qui se passe dans l’environnement et de ressentir les émotions pour en générer lors des interactions. L’objectif est de prendre en compte l’émotion dans les réponses fournies. Mais on est encore au début de l’histoire !
Pour aller plus loin, il nous faudra des retours en termes d’usage que nous n’avons pas aujourd’hui. D’après moi, c’est la partie la plus difficile techniquement.
Aujourd’hui, les utilisateurs souhaitent une IA qui se comporte comme une machine et non pas comme un humain, ce qui pouvait faire partie de fantasmes collectifs dans le passé.
Tout ceci demande un réglage fin, beaucoup de doigté, que ne peuvent pas résoudre les seuls critères mathématiques. Il est nécessaire de bien coller à l’usage, pour personnaliser jusqu’à pouvoir s’adapter à l’humeur des utilisateurs.
La dimension usage est très importante : elle propose un vaste champ d’explorations pour la suite.
Merci Henri de nous avoir permis de mieux comprendre les coulisses de l’écriture et de l’IA ! Sujet à suivre sur ce blog !