Google Traduction est un système de traduction automatique multilingue, développé et fourni par Google, pour traduire du texte, de la voix, des images ou des vidéos en temps réel d’une langue à une autre. Il offre une interface Web, ainsi que des interfaces mobiles pour iOS et Android, et une API, que les développeurs peuvent utiliser pour créer des extensions de navigateur, des applications et d’autres logiciels. Google Traduction a la capacité de traduire en 133 langues à différents niveaux, le système fournit un service gratuit et est utilisé quotidiennement par plus de 200 millions de personnes.
Google a intégré en novembre 2016 son système de traduction automatique neuronale ; un système qui, selon l’entreprise, perfectionnera l’évolution dynamique du traducteur, car il analysera la composition des phrases en tenant compte d’une série de facteurs. Le système apprend au fil du temps et des requêtes des utilisateurs, ce qui améliore la qualité de ses traductions. Pour l’instant, Google a incorporé dans ce système les langues anglaise, Français, allemande, portugaise, espagnole, chinoise, japonaise et turque.
Depuis décembre 2016, la traduction de texte libre est limitée par Google à 5 000 caractères, tandis que la traduction de pages Web n’a pas de limite de longueur.

Caractéristiques de Google Traduction
Interface Web
Pour certaines langues, Google Traduction peut prononcer le texte traduit, mettre en évidence les mots et expressions correspondants dans le texte source et cible, et agir comme un dictionnaire simple pour un seul mot à la fois. Si l’option « Détecter la langue » ou « Texte dans une langue inconnue » est sélectionnée, le système peut identifier automatiquement la langue.
Dans l’interface Web, les utilisateurs peuvent suggérer des traductions alternatives, par exemple pour des termes techniques, ou corriger des erreurs, et ces suggestions seront incluses dans les futures mises à jour du processus de traduction. Si un utilisateur saisit une URL dans le texte d’origine, Google Traduction produira un lien hypertexte vers une traduction automatique du site Web. Pour certaines langues, le texte peut être saisi à l’aide d’un clavier à l’écran, d’une tablette d’écriture manuscrite utilisant des algorithmes de reconnaissance de l’écriture manuscrite ou d’un microphone utilisant un système de reconnaissance vocale.
Intégration du navigateur
Google Traduction est disponible dans certains navigateurs en tant qu’extension qui traduit les textes qu’il collecte sur les sites Web auxquels il accède.
Le système dispose d’une série d’extensions Firefox pour Google Traduction, qui vous permettent de sélectionner des commandes du service de traduction. Il existe également plusieurs gadgets Google disponibles qui utilisent Google Traduction pour s’intégrer à iGoogle et à d’autres sites Web.
Il existe également une extension pour le navigateur Chrome de Google ; En février 2010, Google Traduction a été intégré au navigateur standard de Google Chrome pour traduire automatiquement la page Web consultée.
Interface Google Traduction de l’appareil mobile
L’application est compatible avec plus de 100 langues et permet de traduire : 50 langues à partir d’une photo du texte source, 43 langues à partir de la voix en mode conversation et 27 langues à partir d’une vidéo en temps réel en mode réalité augmentée.
Le mode conversation est une interface Google Traduction qui permet aux utilisateurs de communiquer couramment avec une personne dans une autre langue. L’interface n’est disponible que pour certaines langues.
La fonctionnalité « entrée de la caméra » permet aux utilisateurs de prendre une photo d’un document ou d’un signe et Google Traduction reconnaît le texte de l’image à l’aide de la technologie de reconnaissance optique de caractères (ROC) et donne la traduction dans la langue cible sélectionnée. Le mode d’entrée de l’appareil photo n’est pas disponible pour toutes les langues.
L’application a la capacité de traduire le texte en temps réel à l’aide de l’appareil photo de l’appareil mobile, en utilisant l’option « Instantané ». La vitesse et la qualité de la traduction vidéo caractéristique en temps réel (réalité augmentée) ont été encore améliorées par l’utilisation de réseaux de neurones convolutifs.
Version Android
Google Traduction est disponible en tant qu’application de téléchargement gratuit pour les utilisateurs du système d’exploitation Android. Il fonctionne simplement comme la version du navigateur, Google Traduction pour Android contient deux options principales: « Traduction SMS » et « Historique ».
L’application prend en charge plus de 130 langues et l’entrée vocale a la capacité de traiter 15 langues. Il est disponible pour les appareils fonctionnant sous Android 2.1 et supérieur et peut être téléchargé en recherchant « Google Traduction » sur Google Play. L’application possède la fonctionnalité par laquelle n’importe quelle langue peut être traduite simplement en focalisant le texte sur l’appareil photo de l’appareil mobile et offre également un mode de conversation qui utilise la commande vocale de Google et le stockage en nuage pour traduire le dialogue entre deux personnes qui parlent des langues différentes.
version iOS
Il existe une application Web HTML5 Google Traduction pour iOS pour les utilisateurs iPhone, iPod Touch et iOS. L’application Google Traduction actuelle est compatible avec les iPhone, iPad et iPod Touch mis à jour pour iOS 15.0 ou version ultérieure. Il accepte la saisie vocale en 15 langues et permet la traduction d’un mot ou d’une phrase dans l’une des plus de 500 langues disponibles. Le système a la possibilité de fournir la version traduite du texte en le prononçant à haute voix dans 100 langues différentes.
API
En mai 2011, Google a annoncé que l’API Google Traduction pour les développeurs de logiciels était devenue obsolète et cesserait de fonctionner le 1er décembre 2011, « en raison du coût d’exploitation élevé résultant de l’abus de l’utilisation de la même ». Étant donné que l’API est utilisée sur de nombreux sites Web tiers, cette décision a conduit certains développeurs à critiquer Google et à remettre en question la faisabilité d’utiliser les API de Google dans leurs produits. En réponse à la pression du public, Google a annoncé en juin 2011 que l’API serait toujours disponible via un service payant.
Méthodologie de traduction
Google Traduction n’utilise pas de règles grammaticales, car ses algorithmes sont basés sur une analyse statistique plutôt que sur une analyse basée sur des règles grammaticales traditionnelles. Le créateur original du système, Franz Josef Och, a critiqué l’efficacité des algorithmes basés sur des règles, soulignant la meilleure performance des systèmes basés sur des approches statistiques.
Google Traduction est basé sur une méthode appelée traduction automatique statistique, en particulier sur les résultats des recherches menées par Och avec lesquelles il a remporté le concours DARPA pour la traduction automatique rapide en 2003. Och était à la tête du groupe de traduction automatique de Google jusqu’à ce qu’il quitte l’entreprise pour rejoindre human Longevity en juillet 2014.
Dans son fonctionnement interne, Google Traduction ne traduit pas directement d’une langue à l’autre (I1 → I2). Au contraire, il traduit souvent d’abord de la langue source vers l’anglais, puis de l’anglais vers la langue cible (I1 → EN → I2). Cependant, comme l’anglais, comme toutes les langues humaines, est ambigu et dépend du contexte, cette méthode peut entraîner des erreurs de traduction. Par exemple, la traduction de vous de Français en russe vous donne → vous → ты ou Bы/вы. 31 Si Google devait utiliser un langage artificiel et sans ambiguïté comme intermédiaire, ce serait vous → vous → Bы/вы ou votre → vous → ты
Lorsque Google Traduction traduit, il recherche des modèles dans des centaines de millions de documents pour décider quelle est la meilleure traduction. En détectant des modèles dans les documents traduits par des humains, le système prend des décisions intelligentes quant à la traduction la plus appropriée.
Les langues suivantes n’ont pas de traduction Google directe vers ou depuis l’anglais. Ces langues sont traduites par la langue intermédiaire indiquée (qui est de toute façon étroitement liée à la langue souhaitée, mais est plus largement parlée), puis transmises par l’anglais (dans un processus comprenant trois traductions successives):
- Biélorusse (être ↔ ru ↔ dans ↔ un autre);
- catalan (ca ↔ est ↔ dans ↔ un autre);
- Créole haïtien (ht ↔ fr ↔ dans ↔ un autre);
- galicien (gl ↔ pt ↔ dans ↔ un autre);
- slovaque (sk ↔ cs dans ↔ l’autre ↔);
- ukrainien (uk ↔ ru ↔ dans ↔ un autre);
- Ourdou (votre salut ↔ dans ↔ un ↔ autre).
Selon Och, une base solide pour le développement d’un système de traduction automatique statistique utilisable pour une nouvelle paire de langues nécessite d’avoir un corpus de texte bilingue (ou une collection parallèle) de plus de 150 à 200 millions de mots, et deux corpus monolingues chacun de plus d’un milliard de mots. Il est alors possible d’utiliser des modèles statistiques à partir de ces données pour traduire entre ces langues.
Pour acquérir cette énorme quantité de données linguistiques, Google utilise, par exemple, des documents et des rapports des Nations Unies. L’ONU publie normalement ses documents et dossiers dans les six langues officielles de l’ONU, qui a produit un vaste corpus de textes en 6 langues.
Des représentants de Google ont participé à des conférences nationales au Japon, où Google a demandé des données bilingues aux chercheurs.
Lorsque Google Traduction génère une traduction, il recherche des modèles dans des centaines de millions de documents pour aider à choisir la meilleure traduction. En détectant des modèles dans les documents qui ont déjà été traduits par des traducteurs humains, Google Traduction fait des suppositions intelligentes (à l’aide d’un système d’intelligence artificielle) quant à ce que devrait être une traduction appropriée.
Avant octobre 2007, pour les langues autres que l’arabe, le chinois et le russe, Google Traduction utilisait SYSTRAN, un moteur logiciel de traduction utilisé par plusieurs autres services de traduction en ligne tels que Babel Fish (aujourd’hui abandonné). Mais depuis octobre 2007, Google Traduction utilise une technologie propriétaire basée sur la traduction automatique statistique.
Limitations
Google Traduction a ses limites. Le service gratuit limite le nombre de paragraphes et la gamme de termes techniques qui peuvent être traduits, et bien qu’il puisse aider le lecteur à comprendre le contenu général d’un texte dans une autre langue, il ne fournit pas toujours des traductions précises, et parfois le même mot que vous voulez traduire est répété mot pour mot.
Google Traduction essaie de différencier les temps imparfaits des temps parfaits dans les langues romanes de sorte que les actes habituels et continus dans le passé deviennent souvent des événements historiques individuels. Bien qu’apparemment pédant, cela peut entraîner des résultats incorrects qui auraient été évités par un traducteur humain. La connaissance du mode subjonctif est pratiquement inexistante. En revanche, la deuxième personne informelle (vous) est souvent choisie, quel que soit le contexte ou l’usage accepté. Si votre matériel de référence en anglais ne contient que des formulaires « vous », vous avez du mal à traduire dans une langue qui a plus de formes.
Certaines langues produisent de meilleurs résultats que d’autres. Google Traduction fait un travail correct, en particulier lorsque l’anglais est la langue cible et que la langue source est l’une des langues de l’Union européenne en raison du grand nombre de documents traduits par le Parlement européen, auxquels le système a accès. Une analyse de 2010 a conclu que la traduction du Français vers l’anglais est relativement précise, et des analyses menées en 2011 et 2012 ont montré que la traduction de l’italien vers l’anglais est également exacte.
Cependant, si le texte source est court, les traductions automatiques basées sur des règles sont souvent plus performantes ; cet effet est particulièrement évident dans les traductions du chinois vers l’anglais. Alors que les traductions en général peuvent être éditées, en chinois, il n’est pas possible d’éditer des phrases. Au lieu de cela, des ensembles arbitraires de caractères doivent être modifiés, ce qui entraîne des modifications incorrectes.
Les textes écrits en caractères grecs, devanagari, cyrilliques et arabes peuvent être automatiquement translittérés à partir d’équivalents phonétiques écrits dans l’alphabet latin. La version navigateur de Google Traduction offre la possibilité de lire phonétiquement pour la conversion du japonais vers l’anglais. La même option n’est pas disponible dans la version API payante. Il nous donne également une transcription NOAD – New Oxford American Dictionary lorsque nous traduisons un mot de l’anglais dans une autre langue qui est une transcription diacritique.
Pour la plupart des langues les plus populaires, le système dispose d’une fonction audio « synthèse vocale » qui vous permet de lire un texte d’une douzaine de mots dans cette langue. Dans le cas des langues pluricentriques, l’accent du message dépend de la région:
de l’anglais, dans les Amériques, la plupart de la région Asie-Pacifique et Asie occidentale, l’audio utilise un accent américain général avec un ton féminin, tandis qu’en Europe, Hong Kong, la Malaisie, Singapour, la Guyane et toutes les autres parties du monde utilisent un accent anglais britannique avec un ton féminin, un accent particulier est utilisé en Australie, en Nouvelle-Zélande et sur l’île Norfolk; pour les Espagnols, dans les Amériques, un accent espagnol d’Amérique latine est utilisé, tandis que dans les autres parties du monde, un accent est utiliséEspagnol castillan; en portugais en général, un accent de São Paulo est utilisé, sauf pour le Portugal, où son accent natif est utilisé. Pour certaines langues moins utilisées, le synthétiseur vocal open source eSpeak est utilisé; Cependant, la production à l’aide d’un robot vocal peut être difficile à comprendre.
Langues prises en charge par Google Traduction
Depuis juin 2022, Google Traduction prend en charge les 133 langues suivantes.
- Afrikaans
- Aymara
- Albanais
- Allemand
- Amharique
- Arabe
- Arménien
- Assamese
- Azéri
- Bambara
- Bengali
- Bhojpuri
- Biélorusse
- Birman
- Bosniaque
- Bulgare
- Cambodgien
- Canara
- Catalan
- Cebuano
- Tchèque
- Chichewa
- Chinois (Simplifié)
- Chinois (traditionnel)
- Cingalais
- Coréen
- Corse
- Haïtien
- Croate
- Danois
- Dogri
- Slovaque
- Slovène
- Espagnol
- espéranto
- Estonien
- Brebis
- Basque
- Finnois
- Français
- Frison
- Gaélique écossais
- Gallois
- Galicien
- Géorgien
- Grec
- Guarani
- Gujarâtî
- Hausa
- Hawaïen
- Hébreu
- Hindi
- Hmong
- Hongrois
- Igbo
- Ilocano
- Indonésien
- Anglais
- Irlandais
- Islandais
- Italien
- Japonais
- Javanais
- Kazakh
- Kiñaruanda
- Kirghiz
- Konkani
- Krio
- Kurde (Kurmanji)
- Kurde (Sorani)
- Lao
- Latine
- Letton
- Lingala
- Lituanien
- Luganda
- Luxembourgeois
- Macédonien
- Maithili
- Malayalam
- Malaisien
- Maldivien
- Malgache
- Maltais
- Maori
- Marathi
- Meiteilon (Manipuri)
- Mizo
- Mongol
- Néerlandais
- Népalais
- Norvégien
- Oriya
- Oromo
- Punjabi
- Pachtoune
- Perse
- Polonais
- Portugais
- Quechua
- Roumain
- Russe
- Samoan
- Sanskrit
- Sepedi
- Serbe
- Sotho du Sud
- Shona
- Sindhi
- Somali
- Swahili
- Suédois
- Soundanais
- Tagalog
- Thaï
- Tamil
- Tatar
- Tadjik
- Telugu
- Tigrigna
- Tsonga
- Turc
- Turkmène
- Twi
- Ukrainien
- Ouïghour
- Urdu
- Ouzbek
- Vietnamien
- Xhosa
- Yiddish
- Yoruba
- Zoulou
Langues en développement et version bêta de Google Traduction
Les langues suivantes ne sont pas encore prises en charge par Google Traduction, mais vous pouvez contribuer à ces langues via le site Web pour que Google puisse les prendre en charge à l’avenir. En juin 2022, 103 langues sont en développement, dont 9 en version bêta.
Les langues bêta sont plus proches de leur sortie publique et ont une option supplémentaire exclusive pour contribuer qui vous permet d’évaluer jusqu’à 4 traductions de la version bêta en traduisant un texte anglais de 50 caractères maximum.
- Achène
- Adyghé
- Afar BETA
- Ahirani
- Sud de l’Altaï
- Aragonais
- Avar
- Bagheli
- Baloutche
- Bangala
- Baoulé
- Bachkir
- Tuf Batak
- Betawi
- Bodo BÊTA
- Breton
- Kashmiri
- Cantonais
- Chatisgarí
- Tchétchène
- Cherokee
- Chiluba
- Chitonga
- Chittagonio
- Tchouvache
- Cumuco
- Decaní
- Dholuo
- Diula
- Dzongkha
- Edo
- Efik
- Esan
- Fon
- Fulfulde BETA
- Gagaúzo
- Garhwali
- Groenlandais
- Haryanvi
- Hiligainon
- Inuktitut
- Isoko
- Khakasium
- Kamba
- Kanouri
- Karachai-Balkaro
- Karakalpak
- Kashgai
- Kikuyu
- Kokborok
- Lakota
- Luba
- Madurés
- Magahi
- Malais de Kedah
- Malais de Kelantan
- Marvari
- Mazandaraní
- Minangkabau
- Monténégrin
- Mossi
- Navajo
- Ndébélé du Sud
- Népal bhasa BETA
- Occitan
- pampangan
- Pidgin, Nigéria
- K’iche
- Rangpuri
- Rayastani
- Rohingya
- Romanche
- Sadri
- Sel
- Sami du Nord
- Samogitien
- Sango
- Santali BETA
- Saraiki BETA
- Serrano
- Tswana
- Chor
- Sicilien
- Swahili du Congo
- Suryapuri
- Sylheti
- Tamazight BETA
- Tatar de Sibérie
- BÊTA tibétain
- Tiv
- Tok pisin
- Tswa
- Khorasan Turc
- Tuvinian
- Urhobo
- Urrumano
- Varhadi-Nagpuri
- Bandage
- Wolof
- Iakoute
- Yucatèque BETA
- Zazaki
- Zhuang
Licences et composants open source
| Langue | WordNet | Licence |
| Espagnol | Espagnol | CC-BY 3.0/GPL 3 |
| Arabe | Wordnet arabe | |
| Catalan | Référentiel central multilingue | CC-BY-3.0 |
| Chinois | Wordnet chinois | Wordnet |
| Danois | Sylvain | Pas de Wordnet |
| Espagnol | Référentiel central multilingue | CC-BY-3.0 |
| Finnois | FinnWordnet | Wordnet |
| Français | WOLF (WOrdnet Libre du Français) | CeCILL-C |
| Galicien | Référentiel central multilingue | CC-BY-3.0 |
| Hébreu | Wordnet hébreu | Wordnet |
| Hindi | IIT Bombay Wordnet | Indo Wordnet |
| Indonésien | Wordnet Bahasa | Mit |
| Anglais | Princeton Wordnet | Wordnet |
| Italien | MultiWordnet | CC-BY-3.0 |
| Japonais | Wordnet japonais | Wordnet |
| Javanais | Wordnet javanais | Wordnet |
| Malaisien | Wordnet Bahasa | Mit |
| Norvégien | Wordnet norvégien | Wordnet |
| Perse | Wordnet persan | Utilisation gratuite |
| Polonais | plWordnet | Wordnet |
| Portugais | OpenWN-PT | CC-BY-SA-3.0 |
| Thaï | Wordnet thaïlandais | Wordnet |
Commentaires
Peu de temps après le lancement du service de traduction, Google a remporté un concours international pour la traduction automatique anglais-arabe et anglais-chinois.
Erreurs de traduction et bizarreries sur Google Traduction
Étant donné que Google Traduction utilise la correspondance statistique pour traduire, le texte traduit peut parfois inclure des erreurs flagrantes et des phrases apparemment dénuées de sens, en utilisant des termes communs pour des termes communs similaires mais non équivalents dans la langue cible, comme avec la traduction latine, inversant ou modifiant le sens de la phrase demandée.
Le 23 avril 2020, il a été annoncé qu’il avait adopté un nouveau modèle pour réduire les préjugés sexistes qui se produisent entre deux langues, lorsque l’une d’elles fait la distinction entre homme et femme dans les termes neutres de l’autre.
Références (sources)
|
