Pratique de projet en gestion de corpus et de terminologie

Contexte du projet :

Volkswagen est un constructeur automobile de renommée mondiale, proposant de nombreux modèles. Sa demande se concentre principalement dans les trois principales langues : l’allemand, l’anglais et le chinois.


Exigences du client :

Nous devons trouver un prestataire de services de traduction à long terme et espérer que la qualité des traductions soit stable et fiable.

Analyse du projet :

Tang Neng Translation a mené une analyse interne des besoins de son client. Afin de garantir une qualité de traduction stable et fiable, le corpus et la terminologie sont essentiels. Bien que ce client ait déjà accordé une grande importance à l'archivage des documents (versions originales et traduites), et dispose donc des prérequis pour un travail de corpus complémentaire, le problème actuel est le suivant :
1) La majorité des « corpus » autoproclamés par les clients ne constituent pas un véritable « corpus », mais seulement des documents bilingues correspondants qui ne peuvent être réellement utilisés dans le travail de traduction. La prétendue « valeur de référence » n'est qu'un souhait vague et irréaliste qui ne peut être réalisé ;
2) Une petite partie des clients a accumulé des ressources linguistiques, mais ils ne disposent pas de personnel dédié pour les gérer. En raison du changement de prestataires de traduction, les formats des corpus fournis par chaque entreprise sont différents, et il existe souvent des problèmes tels que des traductions multiples d'une même phrase, des traductions multiples d'un même mot et une inadéquation entre le contenu source et la traduction cible dans les corpus, ce qui réduit considérablement la valeur d'application pratique des corpus ;
3) Sans bibliothèque terminologique unifiée, il est possible que différents départements de l'entreprise traduisent la terminologie selon leurs propres versions, ce qui entraîne de la confusion et affecte la qualité du contenu produit par l'entreprise.
En conséquence, Tang Neng Translation a fourni à ses clients des suggestions et offert des services de gestion de corpus et de terminologie.

Points clés du projet :
Traiter les documents bilingues du corpus historique et hors corpus en fonction des différentes situations, évaluer la qualité des actifs du corpus, augmenter ou diminuer les processus en fonction de la qualité et combler les lacunes précédentes ;

Les nouveaux projets incrémentaux doivent impérativement utiliser la TAO, accumuler et gérer les ressources linguistiques et la terminologie, et éviter de créer de nouvelles vulnérabilités.

Réflexion sur le projet et évaluation de son efficacité :
effet:

1. En moins de 4 mois, Tang a pu traiter des documents historiques bilingues à l'aide d'outils d'alignement et de relecture manuelle, tout en organisant les parties auparavant désorganisées du corpus. Il a constitué un corpus de plus de 2 millions de mots et une base de données terminologique de plusieurs centaines d'entrées, jetant ainsi les bases d'une infrastructure solide ;

2. Dans le nouveau projet de traduction, ces corpus et termes ont été immédiatement utilisés, améliorant la qualité et l'efficacité, et gagnant en valeur ;
3. Le nouveau projet de traduction utilise exclusivement des outils de TAO, et le nouveau travail de gestion du corpus et de la terminologie se poursuit sur la base initiale pour un développement à long terme.

Pensée:

1. Absence et établissement de la conscience :
Peu d'entreprises prennent conscience de l'importance des ressources linguistiques, faute de service centralisé de gestion documentaire et linguistique. Chaque service a ses propres besoins en traduction, et le choix des prestataires n'est pas uniforme. Résultat : le patrimoine linguistique de l'entreprise est non seulement incomplet en termes de ressources et de terminologie, mais l'archivage des documents bilingues, dispersés et parfois contradictoires, pose également problème.
Volkswagen est relativement sensibilisée à l'importance de la conservation des documents bilingues, et une attention particulière doit être portée à leur archivage et à leur stockage appropriés. Cependant, faute de maîtrise des outils de production et techniques de la traduction, et en raison d'une compréhension imprécise du terme « corpus », l'entreprise considère les documents bilingues comme de simples références, sans mettre en place de gestion terminologique.
L'utilisation des outils de TAO est devenue incontournable dans la production de traductions modernes, laissant place à des mémoires de traduction pour les textes traités. À l'avenir, les doublons pourront être comparés automatiquement à tout moment grâce aux outils de TAO, et une bibliothèque terminologique pourra être intégrée au système pour détecter automatiquement les incohérences terminologiques. On constate ainsi que, pour la production de traductions, les outils techniques sont essentiels, tout comme les ressources linguistiques et la terminologie, qui sont toutes deux indispensables. Seule leur complémentarité en production permet d'obtenir des résultats de qualité optimale.
Ainsi, la première étape essentielle de la gestion des ressources linguistiques et terminologiques consiste à sensibiliser le public et à clarifier les concepts. Ce n'est qu'en prenant pleinement conscience de leur nécessité et de leur importance que nous pourrons investir et combler les lacunes dans ce domaine pour les entreprises, transformant ainsi les ressources linguistiques en véritables atouts. Un investissement modeste, mais des retombées considérables et durables.

2. Méthodes et exécution

Forts de cette prise de conscience, quelle est la prochaine étape ? Nombre de clients manquent d’énergie et de compétences professionnelles pour mener à bien cette tâche. Les professionnels accomplissent des tâches professionnelles, et Tang Neng Translation, forte de sa longue expérience dans le domaine de la traduction, a identifié ce besoin latent chez ses clients et a lancé le produit « Services de technologie de traduction », qui inclut la « Gestion de corpus et de terminologie ». Ce service externalise la gestion et la maintenance des bases de données de corpus et de terminologie de ses clients, leur permettant ainsi de les gérer efficacement.

Le travail sur les corpus et la terminologie est un travail qui gagne à être entrepris au plus tôt. Il s'agit d'une tâche urgente que les entreprises doivent inscrire à leur ordre du jour, notamment pour les documents techniques et produits, qui sont fréquemment mis à jour, ont une grande valeur de réutilisation et nécessitent une terminologie unifiée.


Date de publication : 9 août 2025