INDUSTRIE DE LA LANGUE ET LES ENJEUX DE L'INGÉNIERIE LINGUISTIQUE.

Informatique

L‘informatique, une discipline scientifique qui s’occupe du traitement automatique de l’information. (Jean-Marie PIERREL : 2000). Avec la prolifération de l’internet et des médias électroniques, l’homme a besoin de se servir des nouvelles technologies pour organiser, stocker, filtrer, traduire la grande masse d’information existante dans le web.

Après la numérisation de la documentation éditée (au début, en format papier et stockée dans les bibliothèques), le travail de l’informaticien dans ce domaine consiste à concevoir des systèmes d’accès à l’information, de gestion et de recherche dont l’utilisateur a besoin pour rester informé sur un domaine quelconque. Ces innovations permettront de faire circuler l’information à travers le web.

Avec le succès des ordinateurs, l’informaticien a réussi à développer des modèles de traitement de l’information lui permettant de communiquer et interagir avec la machine, donnant origine au langage de programmation, nommé aussi langage informatique et défini comme l’ensemble d’instructions cohérentes que l’ordinateur doit exécuter. En effet, c’est le programmeur qui développe les logiciels pour commander les automates.

Ceci-dit, il est important de distinguer le langage artificiel du langage naturel, le premier c’est celui que le programmeur conçoit pour faire opérer les machines et le seconde c’est le langage des êtres humains. Le schéma ci-dessous illustre le fonctionnement du langage.

Comme dans le langage naturel il existe une grammaire de la langue maternelle, dans le langage de programmation, il existe aussi une série de règles à respecter pour que la machine puisse comprendre les indications de l’homme. C’est ce que les informaticiens appellent communément le formalisme algorithmique qui dépend d’une sorte de « langage formel » très explicite et sans ambigüité (Par opposition à langage naturel).

Au départ, l’ordinateur est un « boitier vide » mais avec les instructions d’un algorithme – compris comme une représentation schématique séquentielle des tâches – il est programmé pour résoudre une problématique ou réaliser une tâche. Désormais, l’utilisateur pourra exécuter cette action à travers une interface.

Ayant maîtrisé la programmation des machines pour exécuter les actions dont chaque utilisateur avait besoin, il y a eu la nécessité de développer des systèmes de communication plus complexes pour faire communiquer les machines entre elles mêmes, donnant lieu aux protocoles de communication et aux réseaux de télécommunication.

En ce qui concerne le fonctionnement de la langue, le linguiste explore tous les éléments linguistiques et métalinguistiques tant à l’oral qu’à l’écrit pour expliquer comment et par quels moyens l’individu communique et interagit avec ses compères. En effet, l’un des moyens le plus utilisé de nos jours, c’est l’ordinateur ; ainsi l’informaticien s’intéresse à comprendre la logique de l’information stockée en masse dans les machines.

Il est opportun de mentionner que la linguistique et l’informatique font connaissance grâce à la linguistique du corpus, lorsque le spécialiste de la langue veut faire un approfondissement de l’analyse du discours. Il se sert des appareils pour enregistrer la langue orale. Son intérêt porte sur la parole naturelle pour classer le style du langage, la retranscription est nécessaire afin de visualiser les mots dans leur contexte.

Linguistique

La linguistique s’occupe du fonctionnement de la langue en tant que « système » (Saussure : 1976). La langue est considérée comme un ensemble d’unités linguistiques (mots) qui interagissent entre elles grâce à leur fonction grammaticale. Ainsi, plusieurs composantes entrent en jeux dans ce système : la phonétique et la phonologique, lorsque nous nous référons à l’étude des sons et à la prononciation ; la morphologie et la syntaxe, lorsque nous faisons allusion à la composition et des mots et des phrases; et la sémantique lorsque nous nous intéressons au sens et à la signification des énonces.

Avec l’évolution de l’internet, l’organisation du contenu (thématique et terminologique) est primordiale. En effet, à l’heure actuelle nous distinguons les langages de spécialité : au docteur, à l’avocat, à l’informaticien, au politique… lui est réservée une terminologie selon sa spécialisation.

Or la linguistique est évoquée comme axe rectrice de la terminologie dans le processus de traduction. Car l’analyse des termes est nécessaire pour arriver au classement discursif d’un corpus spécialisé.

Dans le domaine de la traduction, l’intérêt est porté sur la compréhension des mots, les phrases et le sens. L’analyse de chaque terme employé fait appel à la linguistique du point de vue sémantique et morphosyntaxique. Si nous voulons faire une étude approfondie du terme, nous nous rapporterons aux approches synchroniques et diachroniques de la langue car il ne faut pas oublier que la langue évolue au cours du temps.

D’une part le traducteur doit s’intéresser à l’évolution du langage des interlocuteurs – étude diachronique – pour constater que tant à l’oral qu’à l’écrit, la façon de s’exprimer change constamment. D’autre part, le traducteur doit se préoccuper des variations du langage contemporain – étude synchronique – pour caractériser le style de langue de chaque interlocuteur selon son domaine de spécialisation.

Prenons l’exemple d’un médecin hispanophone et d’un médecin francophone ayant acquis les mêmes performances médicales pour décrire une pathologie quelconque; chacun emploiera des termes différents pouvant ou non exister dans l’une ou l’autre langue car le contexte et les facteurs culturels déterminent significativement l’usage de mots et leur signification.

De cette manière, il se peut que les symptômes d’une maladie soient provoqués par un aliment inexistant dans la région du médecin, et par conséquent les interlocuteurs s’expriment différemment.

Exemple.

Le médecin francophone peut dire :

La quiche lorraine a causé de maux d’estomac au patient.

Tant dis que le médecin hispanophone peut s’exprimer :

La tarte française a causé de maux d’estomac au patient.

(La tarta francesa le provocó daños estomacales al paciente.)

Le médecin hispanophone exerçant en Espagne va certainement utiliser le mot tarte française, considérant la valeur pragmatique du mot qui facilite la compréhension immédiate de l’énoncé sans avoir à chercher la signification du terme quiche.

De ce point de vue, la linguistique intervient de façon implicite dans tout travail de traduction, lorsque le traducteur choisit les signifiants graphiques reconnaissables facilement par le lecteur cible. De plus, le message exprimé dans la langue d’origine doit être équivalent à celui de la langue de traduction, au niveau rhétorique, syntaxique et grammatical. Pour cela une analyse exhaustive est requise pour les deux textes (celui de départ et celui d’arrivée), d’abord par la segmentation du discours, afin de repérer la terminologie et sa fonction morphosyntaxique dans son ensemble puis par l’intégralité du discours pour vérifier le sens et la cohérence du message.

L’union de deux disciplines.

L’une considérée comme science exacte et l’autre comme science du langage, la linguistique et l’informatique connaissent une grande connivence de nos jours. Nous pouvons même parler d’une interdépendance vu le contexte de globalisation dans lequel nous vivons.

Comme nous l’avions mentionné précédemment tout utilisateur d’internet est devenu, d’une certaine manière, polyglotte car même si l’information est publiée dans sa langue maternelle dans la mesure du possible, il arrive qu’un document intéressant pour l’utilisateur soit rédigé dans une langue étrangère, stoppant l’accès à l’information.

De là, le vif intérêt à trouver un moyen d’échange performant pour que la langue ne soit plus un facteur de blocage. D’une part, le linguiste en tant que professionnel du langage se contente de favoriser la compréhension du fonctionnement des langues. D’autre part, l’informaticien en tant que professionnel du calcul et la systématisation, privilégie le traitement automatique du langage.

La bonne entente des ces deux professionnels débute lors que la langue dévient un objet d’étude commun. Nous résumons dans un tableau ces similitudes.

Intérêts de la linguistique par rapport à la langue.

  • Le fonctionnement de la langue.
  • La linguistique du corpus : analyse du discours.
  • La grammaire, la syntaxe et la sémantique.
  • Les langues étrangères.

 

Intérêts de l’informatique par rapport à la langue.

  • Le fonctionnement de la langue.
  • L’étude ontologique.
  • L’organisation terminologique & Étiquetage morphosyntaxique.
  • Le web sémantique et la grammaire formelle.
  • La Traduction.

L’ingénierie linguistique est connue pour le traitement automatique des langues naturelles. Le langage naturel s’applique à toute production linguistique – orale ou écrite – de l’être humain. La numérisation de ces productions permet tout traitement informatique; en voici quelques exemples:

  • Les applications d’aide à la rédaction, le cas du fonctionnement du correcteur orthographique avec syntaxique et le résumé automatique.
  • La conception pédagogie multimédia dans l’enseignement des langues étrangères, le cas des exercices d’application grammaticale avec la correction automatique.
  • Les outils d’aide à la traduction, nous y consacrerons une explication plus complète ultérieurement.
  • La conception de dictionnaires électroniques spécialisés à partir des banques terminologiques.
  • L’indexation documentaire pour la gestion de données spécialisées en format texte, audio ou vidéo à partir de mots clés.
  • La recherche d’information, le cas des logiciels intelligents de recherche.
  • Le traitement de l’oral, la reconnaissance et production vocale multilingue. Ceci est l’une des applications les plus dures à maîtriser, compte tenu de les différentes manières de parler de chacun (différences dans l’accentuation, la cadence, etc.)

 
[Mind Map erstellt von Justo Fernández López, nach Kuno Lorenz 1971: 32]
registrelangue

Corpus et Consultation linguistique spécialisée.

Español

Inglés