Le traitement automatique du langage naturel (PNL) est un domaine de l'intelligence artificielle qui permet aux ordinateurs d'analyser et de comprendre le langage humain. Il a été formulé pour construire un logiciel qui génère et comprend des langages naturels afin qu'un utilisateur puisse avoir des conversations naturelles avec son ordinateur plutôt que par le biais de langages de programmation ou artificiels comme Java ou C.
Décomposer le traitement du langage naturel (NLP)
Le traitement automatique du langage naturel (PNL) est une étape d'une mission plus vaste pour le secteur de la technologie - à savoir, utiliser l'intelligence artificielle (IA) pour simplifier le fonctionnement du monde. Le monde numérique a changé la donne pour de nombreuses entreprises, car une population de plus en plus férue de technologie trouve de nouvelles façons d'interagir en ligne entre elles et avec les entreprises. Les médias sociaux ont redéfini le sens de la communauté; la crypto-monnaie a changé la norme de paiement numérique; Le commerce électronique a créé une nouvelle signification du mot commodité, et le stockage dans le cloud a introduit un autre niveau de conservation des données pour les masses.
Grâce à l'IA, des domaines tels que l'apprentissage automatique et l'apprentissage profond ouvrent les yeux sur un monde de toutes les possibilités. L'apprentissage automatique est de plus en plus utilisé dans l'analyse des données pour donner un sens aux mégadonnées. Il est également utilisé pour programmer des chatbots pour simuler des conversations humaines avec des clients. Cependant, ces applications avancées de l'apprentissage automatique ne seraient pas possibles sans l'improvisation du traitement automatique du langage naturel (NLP).
Comment fonctionne réellement la PNL?
La PNL combine l'IA avec la linguistique informatique et l'informatique pour traiter les langues et la parole humaines ou naturelles. Le processus peut être divisé en trois parties. La première tâche de la PNL est de comprendre le langage naturel reçu par l'ordinateur. L'ordinateur utilise un modèle statistique intégré pour exécuter une routine de reconnaissance vocale qui convertit le langage naturel en langage de programmation. Pour ce faire, il décompose un discours récent qu'il entend en petites unités, puis compare ces unités aux unités précédentes d'un discours précédent. La sortie ou le résultat au format texte détermine statistiquement les mots et les phrases qui ont probablement été prononcés. Cette première tâche est appelée le processus de synthèse vocale.
La tâche suivante est appelée le balisage de partie du discours (POS) ou la désambiguïsation des catégories de mots. Ce processus identifie élémentairement les mots dans leurs formes grammaticales comme des noms, des verbes, des adjectifs, du passé, etc. en utilisant un ensemble de règles de lexique codées dans l'ordinateur. Après ces deux processus, l'ordinateur comprend probablement maintenant la signification du discours qui a été prononcé.
La troisième étape prise par un PNL est la conversion de texte en parole. À ce stade, le langage de programmation informatique est converti en un format audible ou textuel pour l'utilisateur. Un chatbot d'actualités financières, par exemple, à qui on pose une question comme «Comment va Google aujourd'hui?» Analysera très probablement les sites de financement en ligne pour les actions de Google, et peut décider de ne sélectionner que des informations telles que le prix et le volume comme réponse.
La PNL tente de rendre les ordinateurs intelligents en faisant croire aux humains qu'ils interagissent avec un autre humain. Le test de Turing, proposé par Alan Turing en 1950, stipule qu'un ordinateur peut être pleinement intelligent s'il peut penser et faire une conversation comme un humain sans que l'humain sache qu'il ou elle parle avec une machine. Jusqu'à présent, un seul ordinateur a réussi le test - un chatbot avec le personnage d'un garçon de 13 ans. Cela ne veut pas dire qu'une machine intelligente est impossible à construire, mais elle décrit les difficultés inhérentes à faire penser ou converser un ordinateur comme un humain. Étant donné que les mots peuvent être utilisés dans différents contextes et que les machines n'ont pas l'expérience réelle que les humains ont pour transmettre et décrire des entités avec des mots, il faudra peut-être un peu plus de temps avant que le monde ne puisse complètement supprimer le langage de programmation informatique.
