1. Accueil
  2. FR
  3. Étudier
  4. Offre de formation
  5. UE
TRAD-B4010

Terminotique, Traductique et Evaluation et entrainement de moteurs de traduction automatique

année académique
2024-2025

Titulaire(s) du cours

Pascaline MERTEN (Coordonnateur), Damien Hansen et Géraldine LONNOY

Crédits ECTS

10

Langue(s) d'enseignement

français

Contenu du cours

Partie « Terminotique »

La partie « Terminotique » ambitionne de préparer les futur∙e∙s traductrices et traducteurs à la maîtrise des aspects informatiques de la gestion des données terminologiques multilingues.

Le cours de Terminotique vise à enseigner aux étudiant∙e∙s l’utilisation d’outils permettant notamment l’extraction automatique de terminologie, la gestion et le traitement de la terminologie.

Au moyen d’explications et d’exercices pratiques, les étudiant∙e∙s aborderont l’évaluation et la manipulation de différents outils : bases de données terminologiques en ligne, outils de gestion de bases terminologiques, outils d’extraction de mots clés, de candidats termes, de contextes sous l’angle de leur pertinence méthodologique.

Le cours prévoit également l’utilisation de corpus, dans une perspective de recherche de candidats termes, de contextes et d’éléments définitoires dans des textes spécialisés, éventuellement bilingues.

Les étudiant∙e∙s se pencheront aussi sur différents formats (notamment le langage XML) dans un contexte d’échange de données terminologiques multilingues.

Partie Traductique

Ce cours développe des fonctionnalités avancées des outils d'aide à la traduction, Trados Studio et MemoQ, en particulier pour la gestion des mémoires de traduction et la définition de filtres visant à prendre en charge des formats de fichiers particuliers.
Le fil rouge du cours est l'utilisation des expressions régulières (REGEX) qui sont vues à des fins de révision, de paramétrage des outils et de conversion de fichiers dans un traitement de texte, un éditeur de texte, dans les corpus dans les OAT et en Python.

Partie « Évaluation et entrainement de moteurs de TA »

Ce volet vise à illustrer les différentes étapes du développement d’un système de traduction automatique de bout en bout. Le cours abordera ainsi des principes de programmation sur Linux, le traitement de corpus pour le traitement automatique des langues, le fonctionnement général des réseaux de neurones pour la traduction automatique, l’entraînement de systèmes au moyen de notebooks interactifs, ainsi qu’une réflexion et des exercices pratiques sur l’évaluation des sorties de TA.




 

Objectifs (et/ou acquis d'apprentissages spécifiques)

Partie « Terminotique »

  • Être capable de créer, d’alimenter et d’exploiter une base de données terminologique à l’aide d’un outil de gestion terminologique et d’y importer des informations de formats variés.
  • Être capable d’évaluer la qualité et la fiabilité d’une base de données terminologique en ligne et ses fonctionnalités.
  • Mettre en œuvre des outils et méthodes de la linguistique de corpus dans une perspective d’extraction terminologique.
  • Maîtriser les formats d’échange de données terminologiques (langage XML) et leur intérêt dans différents contextes professionnels.
  • Être capable de concevoir un modèle de fiche terminologique conformes aux exigences de l’ISO et d’évaluer les capacités réelles d’un logiciel de gestion terminologique.
  • Être capable d’identifier les points faibles et forts de nouveaux outils informatiques consacrés à la gestion de la terminologie.

Partie « Traductique »

Au terme de cette ACTA, l'étudiant sera capable de:

  • Identifier le format d'un fichier et de déterminer la meilleure procédure à suivre pour qu'il puisse être pris en charge dans un OAT
  • Utiliser et paramétrer les différents OAT ;
  • Identifier et de définir les différents langages de balisage, en particulier les formats XML utilisé en TAO et de convertir des fichiers d’un format à l’autre ;
  • Écrire des expressions régulières ;
  • Réaliser un programme de base en Python, utilisant des regex pour convertir des fichiers ou le traduire automatiquement.

Partie « Évaluation et entrainement de moteurs de TA »

À l’issue de cette UE, le public sera en mesure de :
  • Transformer un texte depuis un format classique de traitement de texte en un format lisible par la machine.
  • Décrire dans les grandes lignes le fonctionnement et les étapes de l’entraînement des systèmes de traduction automatique.
  • Évaluer rapidement et de façon entièrement automatique une sortie de TA.
  • Avoir conscience des limites des évaluations automatiques et proposer d’autres pistes d’évaluation intégrant notamment les compétences propres à la traduction humaine.

Pré-requis et Co-requis

Connaissances et compétences pré-requises ou co-requises

Avoir suivi ou suivre le cours de terminologie (TRAD-B-4002) et le cours d’outils d’aide à la traduction (TRAD-B-4005), maîtriser l’outil informatique.
Trados Studio sera réputé connu.

Méthodes d'enseignement et activités d'apprentissages

Partie « Terminotique »

Cours ex cathedra, cours à distance, conférences, exercices pratiques.

Partie « Traductique »

Cours ex cathedra et exercices pratiques.

Partie « Évaluation et entrainement de moteurs de TA »

Cours magistral et exercices pratiques
 

Références, bibliographie et lectures recommandées

Partie « Terminotique »

  • Loock, R. (2016). La traductologie de corpus. Villeneuve-d’Ascq: Presses universitaires du Septentrion.
  • Pearson, J. (1998). Terms in Context. Amsterdam: John Benjamins.
  • Sager, J. C. (1990). A Practical Course in Terminology Processing. Amsterdam: J. Benjamins Pub. Co.
  • Wright, S. E., & Budin, G. (1997-2001). Handbook of Terminology Management (Vol. vol. I : Basic Aspects of Terminology Management, vol. II : Applications Oriented Terminology Management). Amsterdam: John Benjamins Publishing.
  • Zanettin, F. (2012). Translation drive-corpora. Manchester: St. Jerome Publishing.

Partie « Traductique»

Aide des différents outils utilisés
  • Chaumartin, F.-R. et Lemberger, P. (2020), Le traitement automatique des langues. Comprendre les textes grâce à l'intelligence artificielle, Dunod
  • EAMT and IAMT Summits, actes des congrès
  • ESSELINK, B. (2000), A Practical Guide to Localization, Benjamins
  • KOEHN, Ph. (2020), Neural Machine Translation, Cambridge University Press
  • Loock, R. (2016). La traductologie de corpus. Villeneuve-d’Ascq: Presses universitaires du Septentrion.
  • WAY (Andy) (2011), "Statistical Machine Translation: A Guide for Linguists and Translators", Language and Linguistics Compass 5/5 (2011): 205–226
 

Partie « Évaluation et entrainement de moteurs de TA »

  • Blanchon, Hervé et Christian Boitet. « Pour l’évaluation externe des systèmes de TA par des méthodes fondées sur la tâche ». Traitement Automatique des Langues, vol. 48, nᵒ 1, 2007, p. 33–65.
  • Forcada, Mikel « Making sense of neural machine translation ». Translation Spaces, vol. 6, nᵒ 2, 2017, p. 291–309.
  • Kenny, Dorothy (éd.). Machine translation for everyone: Empowering users in the age of artificial intelligence. Language Science Press, 2022.
  • Moorkens, Joss, Andy Way et Séamus Lankford (éd.). Automating Translation. Routledge, 2024.
  • Nakhlé, Mariam. « L’évaluation de la traduction automatique du caractère au document : un état de l’art ». Actes de CORIA-TALN 2023, édité par Marie Candito, Thomas Gerald et José Moreno, ATALA, 2023, p. 143–159.
  • Poibeau, Thierry. Babel 2.0 : Où va la traduction automatique ? Odile Jacob, 2019.
  • Way, Andy. « Statistical Machine Translation: A Guide for Linguists and Translators ». Languages and Linguistics Compass, vol. 5, n° 5, 2011, p. 205–226.
  • Yvon, François. « Les deux voies de la traduction automatique ». Hermès, vol. 85, nᵒ 3, 2019, p. 62–68.

Support(s) de cours

  • Podcast
  • Université virtuelle

Contribution au profil d'enseignement

1. Compétences linguistiques

  • Utiliser des connaissances linguistiques théoriques et pratiques dans le domaine de la traduction

2. Compétences thématiques

  • S’initier aux domaines de spécialité, aux jargons, aux sociolectes et à leur terminologie propre
  • Identifier ses besoins en information et documentation
  • Maitriser les outils et techniques de recherche documentaire et terminologique
  • Développer des critères d’évaluation de la fiabilité des sources
  • Utiliser efficacement les outils et moteurs de recherche

3. Compétences technologiques

  • Mobiliser des connaissances technologiques :
  • Gérer son environnement informatique ; gérer ses fichiers et sa documentation ; manier les outils et les techniques de recherche documentaire et terminologique
  • Utiliser les outils d’aide à la traduction
  • S’adapter en permanence aux nouvelles technologies de l’information et de la communication, notamment à la localisation
  • Actualiser son savoir-faire technologique en suivant les innovations techniques/technologiques du domaine, ainsi que les nouveaux champs d’application des métiers
  • Participer, le cas échéant, à des projets de recherche appliquée dans le domaine des technologies de la traduction

4. Compétences déontologiques et professionnelles

  • Maitriser la production professionnelle de traductions et gérer les relations interpersonnelles :
  • Négocier les conditions et le prix d’une production avec le donneur d’ouvrage
  • Être capable de travailler tant en autonomie qu’en collaboration avec les auteurs et les intervenants du projet

Autres renseignements

Contacts

Pascaline Merten : pascaline.merten@ulb.be
Damien Hansen : damien.hansen2@ulb.be
Géraldine Lonnoy : geraldine.lonnoy@ulb.be

Campus

Solbosch

Evaluation

Méthode(s) d'évaluation

  • Travail pratique
  • Examen écrit

Travail pratique

Examen écrit

Construction de la note (en ce compris, la pondération des notes partielles)

Moyenne pondérée

Langue(s) d'évaluation

  • français

Programmes