Un chatbot arabe est un programme capable de comprendre et d’analyser du contenu en arabe. Aujourd’hui, il est possible de simuler et de traiter une conversation humaine en arabe entre un ordinateur et une personne.
Les récentes avancées dans la technologie de traitement du langage naturel (NLP) facilitent la création de chatbots arabes. La nouvelle technologie de chatbot IA en arabe utilise l'apprentissage automatique pour comprendre la structure de la langue ainsi que le « sens » des mots.
L’arabe est la quatrième langue la plus parlée sur Internet, mais c’est aussi l’une des plus difficiles à apprendre pour les non-natifs.
Cela s’explique par plusieurs différences avec la plupart des autres langues.
En plus de cela, il existe de nombreuses formes et dialectes de l’arabe. Ces variantes sont liées mais ne se recoupent pas. En réalité, un dialecte peut être incompréhensible pour un locuteur d’un autre dialecte ; pour ainsi dire, ce sont des langues différentes.
Tous ces facteurs font que l’arabe est plus difficile à apprendre pour les humains.
Mais cela signifie-t-il aussi que les machines ont plus de mal à l’apprendre ? Sans surprise, la réponse est oui.
Tous ces éléments compliquent le traitement du langage naturel (NLP) en arabe. La première étape de tout algorithme NLP consiste à comprendre la langue, c’est-à-dire à découper les phrases en unités de sens distinctes. Cette tâche s’appelle officiellement la tokenisation, chaque unité de sens étant appelée un token.
Plus une langue est systématique et ordonnée, plus il est facile de la découper en tokens.
Les mêmes difficultés qui rendent l’arabe difficile à apprendre pour les humains compliquent aussi la tokenisation par rapport à d’autres langues courantes.
Avant de saisir l’importance des dernières avancées, il faut d’abord comprendre comment un modèle linguistique NLP était conçu auparavant.
La tokenisation de la langue nécessitait beaucoup d’intervention manuelle de la part des chercheurs en NLP. Chaque langue devait être tokenisée séparément, et en grande partie à la main.
Ce travail était particulièrement ardu pour les bots arabes, comme on peut l’imaginer.
Une fois la langue tokenisée, les algorithmes d’IA pouvaient être appliqués pour comprendre la langue, c’est-à-dire établir une carte des relations de sens entre les mots.
Cette étape de compréhension pouvait être automatisée si la tokenisation était fiable. Mais le problème, c’est que la tokenisation de l’arabe était complexe, et même les algorithmes de compréhension devaient donc être configurés manuellement, en plus de la tokenisation.
Le résultat final n’était pas satisfaisant. Le niveau de compréhension de l’arabe était bien inférieur à celui de l’anglais, par exemple. Bien sûr, la recherche s’est toujours davantage concentrée sur l’anglais que sur l’arabe, ce qui a aussi joué un rôle, mais la difficulté de la langue rendait presque impossible d’obtenir de bons résultats.
Comme tout chercheur en IA, ils se sont demandé si la tokenisation pouvait être réalisée par apprentissage automatique. Cela permettrait aux algorithmes de tokenisation et de compréhension d’être indifférents à la langue (on parle alors d’approche agnostique), ce qui accélérerait et améliorerait l’entraînement de l’IA sur une nouvelle langue.
C’est précisément là qu’une avancée majeure a eu lieu fin 2018. L’IA a pu être entraînée en arabe sans intervention manuelle, ce qui a nettement amélioré les performances du NLP.
Les plateformes de chatbots arabes ont pu progresser instantanément, et la compréhension de l’arabe par les chatbots a atteint un niveau comparable à celui des autres langues.
Cela ne signifie pas pour autant que la qualité des chatbots arabes s’est immédiatement améliorée.
Pour que les utilisateurs bénéficient de ces avancées, il fallait d’abord que les plateformes de chatbots mettent à jour leurs algorithmes avec la nouvelle technologie. Étant donné leurs investissements dans les anciennes solutions, cela n’a pas été fait rapidement.
Par ailleurs, de nombreuses fonctionnalités doivent être mises en place pour garantir une bonne expérience utilisateur avec les chatbots arabes. Par exemple, l’interface utilisateur doit être adaptée à l’arabe. Cela peut être aussi simple que de vérifier l’alignement du chat ou l’ordre d’affichage des boutons.
Gérer plusieurs langues sur différentes plateformes peut être complexe. Certaines imposent de créer un bot distinct pour chaque langue, ce qui est évidemment très inefficace.
Une bonne plateforme sera véritablement multilingue et permettra donc de traduire tous les contenus de l’interface utilisateur.
En outre, la langue doit être suivie comme une variable de la conversation afin que l’IA puisse la détecter précisément et que les concepteurs conversationnels puissent adapter la logique en fonction de la langue.
Au-delà des fonctionnalités liées à la langue, pour créer un excellent chatbot, la plateforme doit offrir des fonctionnalités générales de grande qualité. Deux catégories de fonctionnalités sont essentielles.
Au final, la qualité de l’expérience chatbot pour l’utilisateur dépend directement de la puissance de l’outil utilisé, de la compréhension linguistique à l’interface graphique.
Il arrive aussi souvent, notamment dans le monde arabe, que les entreprises exigent un chatbot arabe sur site. C’est un critère à prendre en compte lors du choix d’une plateforme. Un chatbot arabe sur site doit être développé avec une plateforme adaptée, qui propose non seulement une interface sur site mais aussi le moteur NLU complet et le modèle linguistique entraîné en local.
Même avec une bonne plateforme, créer un excellent chatbot en arabe reste un défi. Il y a peu de locuteurs arabes dans le domaine de l’IA, ce qui complique la recherche de ressources adaptées pour le projet. Il n’est pas nécessaire de développer les algorithmes NLU de base, car ils sont fournis, mais il peut être difficile de trouver des concepteurs compétents maîtrisant toutes les langues ou dialectes pris en charge par le chatbot. Il est donc essentiel que la plateforme permette de mettre à jour et de gérer facilement le contenu et les traductions, même pour des personnes non techniques, car le concepteur ne parlera probablement pas toutes les langues supportées.
Évidemment, l’arrivée de chatbots arabes de qualité va accélérer l’adoption de cette technologie. Cette adoption croissante résoudra les problèmes de ressources et permettra aux futurs utilisateurs de mieux identifier les bonnes pratiques à suivre.
Les avancées du NLP ne concernent pas seulement les chatbots arabes, mais aussi d’autres applications de l’IA. On voit désormais apparaître des systèmes polyvalents utilisant l’IA arabe de différentes manières — de l’analyse de sentiments dans les actualités à la génération ou au résumé de textes, tâches auparavant réservées aux humains. Souvent, le chatbot sert d’interface utilisateur non seulement pour différentes technologies d’IA, mais aussi pour aider les utilisateurs à naviguer sur d’autres systèmes, comme des sites web ou des applications.
Bien sûr, même si la compréhension du langage naturel en arabe a fait un bond en avant, il reste des progrès à faire. La recherche continue d’améliorer les moteurs NLU, et de nouvelles avancées ne manqueront pas d’arriver. Tant que la NLU n’atteindra pas le niveau humain, il restera du travail à accomplir.
La prochaine étape pour tous les moteurs NLU, quelle que soit la langue, est d’améliorer la gestion des dialogues à plusieurs tours. Cela signifie permettre à un humain d’avoir une conversation en plusieurs étapes avec le bot sur un sujet précis, et pas seulement de poser des questions isolées. Pour les plateformes de chatbots, il s’agit aussi de faciliter la création de ces dialogues complexes.
Le dialogue à plusieurs tours est particulièrement important pour les interfaces vocales comme Alexa.
Si nous avons parlé des avancées de la tokenisation par apprentissage automatique et de leur impact sur le NLP arabe, un sujet connexe est la transcription vocale en texte pour l’arabe. Cette technologie reste en retard par rapport à d’autres langues, mais on peut espérer que les progrès du NLP contribueront à combler cet écart prochainement.
Créez des expériences d'agents IA exceptionnelles.