Le Traitement Automatique des Langues chez ERDIL

Catégorie(s) : L'expertise linguistique

Le 26 septembre, c’est la Journée Européenne des Langues ! Après un premier article sur la place des langues au sein d’ERDIL, nous vous proposons cette année de (re)découvrir comment ERDIL intègre les technologies de Traitement Automatique des Langues (TAL) à ses activités.

Concrètement, le Traitement Automatique des Langues, c’est quoi ?

Le Traitement Automatique des Langues est une discipline à la croisée des chemins entre linguistique et informatique. L’objectif du TAL ou TALN (on parle alors de Langage Naturel) est de permettre à des dispositifs informatiques de reconnaître, comprendre et interpréter les langages « humains » de manière automatisée : langage parlé, langage écrit, langage des signes…

L’utilisation des technologies de TAL est évidente pour les solutions de traduction ou correction (orthographique / grammaticale) automatique mais ces domaines sont loin d’être les seuls. La robotique et l’intelligence artificielle, qui connaissent un essor considérable ces dernières années, sont aussi des secteurs particulièrement en demande de profils spécialisés dans ces technologies.

Récemment, deux exemples révélateurs de ces avancées technologiques ont émergé : les chatbots et les assistants personnels tels qu’Alexa et Echo (Amazon), Google Home ou HomePod (Apple)… L’ensemble de ces systèmes nécessitent une compréhension du langage particulièrement avancée afin de proposer des réponses ou des actions efficaces et en adéquation avec les demandes de l’utilisateur.

L’application du Traitement Automatique des Langues chez ERDIL

Dans notre activité, les méthodes de TAL sont appliquées au « text mining » où la compréhension et la structuration de données issues du big data sont les points centraux. En pratique, l’objectif est de modéliser la façon dont les clients s’expriment afin de détecter, dans leurs messages, les sujets abordés ainsi que leurs tonalités.

Dans ce cadre, l’application des techniques de Traitement Automatique des Langues est soumise à certaines spécificités :

  • au départ d’un projet, les grammaires sont élaborées par nos linguistes à partir d’un corpus de messages clients déjà recueillis par l’entreprise. Mais une langue naturelle, à l’inverse d’un langage formel, connaît de nombreuses variations. Ainsi les règles de détection initiales sont, elles aussi, constamment enrichies afin d’obtenir l’analyse la plus fine possible.
  • travailler sur des verbatim clients implique de prendre en compte une forme de langage usitée contrairement aux formes normées, habituelles dans le cadre de la recherche. Le langage usité est beaucoup plus complexe à appréhender puisqu’il inclut son lot d’erreurs syntaxiques / sémantiques / orthographiques, de déformations, d’ambiguïtés, etc.

À l’heure actuelle, l’équipe linguistique d’ERDIL est en mesure d’analyser des verbatim issus de huit langues. Un chiffre en constante évolution puisque de nombreuses sociétés, présentes à l’international, sont fortement intéressées par le déploiement du dispositif d’analyse sur leurs différents marchés.

Alors, si vous êtes passionné(e) par les langues, si le TAL est votre domaine de prédilection et si vous aimez autant partager vos brèves de verbatim que des viennoiseries avec les autres collaborateurs, n’hésitez pas à nous contacter !

Date

26 septembre 2017

Auteur
Logo ERDIL

ERDIL