Google Traduction

Google Traduction

Google Traduction est un système de traduction automatique multilingue, développé et fourni par Google, pour traduire du texte, de la voix, des images ou des vidéos en temps réel d’une langue à une autre. Il offre une interface Web, ainsi que des interfaces mobiles pour iOS et Android, et une API, que les développeurs peuvent utiliser pour créer des extensions de navigateur, des applications et d’autres logiciels. Google Traduction a la capacité de traduire en 133 langues à différents niveaux, le système fournit un service gratuit et est utilisé quotidiennement par plus de 200 millions de personnes.

Google a intégré en novembre 2016 son système de traduction automatique neuronale ; un système qui, selon l’entreprise, perfectionnera l’évolution dynamique du traducteur, car il analysera la composition des phrases en tenant compte d’une série de facteurs. Le système apprend au fil du temps et des requêtes des utilisateurs, ce qui améliore la qualité de ses traductions. Pour l’instant, Google a incorporé dans ce système les langues anglaise, Français, allemande, portugaise, espagnole, chinoise, japonaise et turque.

Depuis décembre 2016, la traduction de texte libre est limitée par Google à 5 000 caractères, tandis que la traduction de pages Web n’a pas de limite de longueur.

Google traduction
Capture d’écran de la version de bureau de Google Traduction

Caractéristiques de Google Traduction

Interface Web

Pour certaines langues, Google Traduction peut prononcer le texte traduit, mettre en évidence les mots et expressions correspondants dans le texte source et cible, et agir comme un dictionnaire simple pour un seul mot à la fois. Si l’option « Détecter la langue » ou « Texte dans une langue inconnue » est sélectionnée, le système peut identifier automatiquement la langue.

Dans l’interface Web, les utilisateurs peuvent suggérer des traductions alternatives, par exemple pour des termes techniques, ou corriger des erreurs, et ces suggestions seront incluses dans les futures mises à jour du processus de traduction. Si un utilisateur saisit une URL dans le texte d’origine, Google Traduction produira un lien hypertexte vers une traduction automatique du site Web. Pour certaines langues, le texte peut être saisi à l’aide d’un clavier à l’écran, d’une tablette d’écriture manuscrite utilisant des algorithmes de reconnaissance de l’écriture manuscrite ou d’un microphone utilisant un système de reconnaissance vocale.

Intégration du navigateur

Google Traduction est disponible dans certains navigateurs en tant qu’extension qui traduit les textes qu’il collecte sur les sites Web auxquels il accède.

Le système dispose d’une série d’extensions Firefox pour Google Traduction, qui vous permettent de sélectionner des commandes du service de traduction. Il existe également plusieurs gadgets Google disponibles qui utilisent Google Traduction pour s’intégrer à iGoogle et à d’autres sites Web.

Il existe également une extension pour le navigateur Chrome de Google ; En février 2010, Google Traduction a été intégré au navigateur standard de Google Chrome pour traduire automatiquement la page Web consultée.

Interface Google Traduction de l’appareil mobile

L’application est compatible avec plus de 100 langues et permet de traduire : 50 langues à partir d’une photo du texte source, 43 langues à partir de la voix en mode conversation et 27 langues à partir d’une vidéo en temps réel en mode réalité augmentée.

Le mode conversation est une interface Google Traduction qui permet aux utilisateurs de communiquer couramment avec une personne dans une autre langue. L’interface n’est disponible que pour certaines langues.

La fonctionnalité « entrée de la caméra » permet aux utilisateurs de prendre une photo d’un document ou d’un signe et Google Traduction reconnaît le texte de l’image à l’aide de la technologie de reconnaissance optique de caractères (ROC) et donne la traduction dans la langue cible sélectionnée. Le mode d’entrée de l’appareil photo n’est pas disponible pour toutes les langues.

L’application a la capacité de traduire le texte en temps réel à l’aide de l’appareil photo de l’appareil mobile, en utilisant l’option « Instantané ». La vitesse et la qualité de la traduction vidéo caractéristique en temps réel (réalité augmentée) ont été encore améliorées par l’utilisation de réseaux de neurones convolutifs.

Version Android

Google Traduction est disponible en tant qu’application de téléchargement gratuit pour les utilisateurs du système d’exploitation Android. Il fonctionne simplement comme la version du navigateur, Google Traduction pour Android contient deux options principales: « Traduction SMS » et « Historique ».

L’application prend en charge plus de 130 langues et l’entrée vocale a la capacité de traiter 15 langues. Il est disponible pour les appareils fonctionnant sous Android 2.1 et supérieur et peut être téléchargé en recherchant « Google Traduction » sur Google Play. L’application possède la fonctionnalité par laquelle n’importe quelle langue peut être traduite simplement en focalisant le texte sur l’appareil photo de l’appareil mobile et offre également un mode de conversation qui utilise la commande vocale de Google et le stockage en nuage pour traduire le dialogue entre deux personnes qui parlent des langues différentes.

version iOS

Il existe une application Web HTML5 Google Traduction pour iOS pour les utilisateurs iPhone, iPod Touch et iOS. L’application Google Traduction actuelle est compatible avec les iPhone, iPad et iPod Touch mis à jour pour iOS 15.0 ou version ultérieure. Il accepte la saisie vocale en 15 langues et permet la traduction d’un mot ou d’une phrase dans l’une des plus de 500 langues disponibles. Le système a la possibilité de fournir la version traduite du texte en le prononçant à haute voix dans 100 langues différentes.

API

En mai 2011, Google a annoncé que l’API Google Traduction pour les développeurs de logiciels était devenue obsolète et cesserait de fonctionner le 1er décembre 2011, « en raison du coût d’exploitation élevé résultant de l’abus de l’utilisation de la même ». Étant donné que l’API est utilisée sur de nombreux sites Web tiers, cette décision a conduit certains développeurs à critiquer Google et à remettre en question la faisabilité d’utiliser les API de Google dans leurs produits. En réponse à la pression du public, Google a annoncé en juin 2011 que l’API serait toujours disponible via un service payant.

Méthodologie de traduction

Google Traduction n’utilise pas de règles grammaticales, car ses algorithmes sont basés sur une analyse statistique plutôt que sur une analyse basée sur des règles grammaticales traditionnelles. Le créateur original du système, Franz Josef Och, a critiqué l’efficacité des algorithmes basés sur des règles, soulignant la meilleure performance des systèmes basés sur des approches statistiques.

Google Traduction est basé sur une méthode appelée traduction automatique statistique, en particulier sur les résultats des recherches menées par Och avec lesquelles il a remporté le concours DARPA pour la traduction automatique rapide en 2003. Och était à la tête du groupe de traduction automatique de Google jusqu’à ce qu’il quitte l’entreprise pour rejoindre human Longevity en juillet 2014.

Dans son fonctionnement interne, Google Traduction ne traduit pas directement d’une langue à l’autre (I1 → I2). Au contraire, il traduit souvent d’abord de la langue source vers l’anglais, puis de l’anglais vers la langue cible (I1 → EN → I2). Cependant, comme l’anglais, comme toutes les langues humaines, est ambigu et dépend du contexte, cette méthode peut entraîner des erreurs de traduction. Par exemple, la traduction de vous de Français en russe vous donne → vous → ты ou Bы/вы. 31 Si Google devait utiliser un langage artificiel et sans ambiguïté comme intermédiaire, ce serait vous → vous → Bы/вы ou votre → vous → ты

Lorsque Google Traduction traduit, il recherche des modèles dans des centaines de millions de documents pour décider quelle est la meilleure traduction. En détectant des modèles dans les documents traduits par des humains, le système prend des décisions intelligentes quant à la traduction la plus appropriée.

Les langues suivantes n’ont pas de traduction Google directe vers ou depuis l’anglais. Ces langues sont traduites par la langue intermédiaire indiquée (qui est de toute façon étroitement liée à la langue souhaitée, mais est plus largement parlée), puis transmises par l’anglais (dans un processus comprenant trois traductions successives):

  • Biélorusse (être ↔ ru ↔ dans ↔ un autre);
  • catalan (ca ↔ est ↔ dans ↔ un autre);
  • Créole haïtien (ht ↔ fr ↔ dans ↔ un autre);
  • galicien (gl ↔ pt ↔ dans ↔ un autre);
  • slovaque (sk ↔ cs dans ↔ l’autre ↔);
  • ukrainien (uk ↔ ru ↔ dans ↔ un autre);
  • Ourdou (votre salut ↔ dans ↔ un ↔ autre).

Selon Och, une base solide pour le développement d’un système de traduction automatique statistique utilisable pour une nouvelle paire de langues nécessite d’avoir un corpus de texte bilingue (ou une collection parallèle) de plus de 150 à 200 millions de mots, et deux corpus monolingues chacun de plus d’un milliard de mots. Il est alors possible d’utiliser des modèles statistiques à partir de ces données pour traduire entre ces langues.

Pour acquérir cette énorme quantité de données linguistiques, Google utilise, par exemple, des documents et des rapports des Nations Unies. L’ONU publie normalement ses documents et dossiers dans les six langues officielles de l’ONU, qui a produit un vaste corpus de textes en 6 langues.

Des représentants de Google ont participé à des conférences nationales au Japon, où Google a demandé des données bilingues aux chercheurs.

Lorsque Google Traduction génère une traduction, il recherche des modèles dans des centaines de millions de documents pour aider à choisir la meilleure traduction. En détectant des modèles dans les documents qui ont déjà été traduits par des traducteurs humains, Google Traduction fait des suppositions intelligentes (à l’aide d’un système d’intelligence artificielle) quant à ce que devrait être une traduction appropriée.

Avant octobre 2007, pour les langues autres que l’arabe, le chinois et le russe, Google Traduction utilisait SYSTRAN, un moteur logiciel de traduction utilisé par plusieurs autres services de traduction en ligne tels que Babel Fish (aujourd’hui abandonné). Mais depuis octobre 2007, Google Traduction utilise une technologie propriétaire basée sur la traduction automatique statistique.

Limitations

Google Traduction a ses limites. Le service gratuit limite le nombre de paragraphes et la gamme de termes techniques qui peuvent être traduits, et bien qu’il puisse aider le lecteur à comprendre le contenu général d’un texte dans une autre langue, il ne fournit pas toujours des traductions précises, et parfois le même mot que vous voulez traduire est répété mot pour mot.

Google Traduction essaie de différencier les temps imparfaits des temps parfaits dans les langues romanes de sorte que les actes habituels et continus dans le passé deviennent souvent des événements historiques individuels. Bien qu’apparemment pédant, cela peut entraîner des résultats incorrects qui auraient été évités par un traducteur humain. La connaissance du mode subjonctif est pratiquement inexistante. En revanche, la deuxième personne informelle (vous) est souvent choisie, quel que soit le contexte ou l’usage accepté. Si votre matériel de référence en anglais ne contient que des formulaires « vous », vous avez du mal à traduire dans une langue qui a plus de formes.

Certaines langues produisent de meilleurs résultats que d’autres. Google Traduction fait un travail correct, en particulier lorsque l’anglais est la langue cible et que la langue source est l’une des langues de l’Union européenne en raison du grand nombre de documents traduits par le Parlement européen, auxquels le système a accès. Une analyse de 2010 a conclu que la traduction du Français vers l’anglais est relativement précise, et des analyses menées en 2011 et 2012 ont montré que la traduction de l’italien vers l’anglais est également exacte.

Cependant, si le texte source est court, les traductions automatiques basées sur des règles sont souvent plus performantes ; cet effet est particulièrement évident dans les traductions du chinois vers l’anglais. Alors que les traductions en général peuvent être éditées, en chinois, il n’est pas possible d’éditer des phrases. Au lieu de cela, des ensembles arbitraires de caractères doivent être modifiés, ce qui entraîne des modifications incorrectes.

Les textes écrits en caractères grecs, devanagari, cyrilliques et arabes peuvent être automatiquement translittérés à partir d’équivalents phonétiques écrits dans l’alphabet latin. La version navigateur de Google Traduction offre la possibilité de lire phonétiquement pour la conversion du japonais vers l’anglais. La même option n’est pas disponible dans la version API payante. Il nous donne également une transcription NOAD – New Oxford American Dictionary lorsque nous traduisons un mot de l’anglais dans une autre langue qui est une transcription diacritique.

Pour la plupart des langues les plus populaires, le système dispose d’une fonction audio « synthèse vocale » qui vous permet de lire un texte d’une douzaine de mots dans cette langue. Dans le cas des langues pluricentriques, l’accent du message dépend de la région:

de l’anglais, dans les Amériques, la plupart de la région Asie-Pacifique et Asie occidentale, l’audio utilise un accent américain général avec un ton féminin, tandis qu’en Europe, Hong Kong, la Malaisie, Singapour, la Guyane et toutes les autres parties du monde utilisent un accent anglais britannique avec un ton féminin, un accent particulier est utilisé en Australie, en Nouvelle-Zélande et sur l’île Norfolk; pour les Espagnols, dans les Amériques, un accent espagnol d’Amérique latine est utilisé, tandis que dans les autres parties du monde, un accent est utiliséEspagnol castillan; en portugais en général, un accent de São Paulo est utilisé, sauf pour le Portugal, où son accent natif est utilisé. Pour certaines langues moins utilisées, le synthétiseur vocal open source eSpeak est utilisé; Cependant, la production à l’aide d’un robot vocal peut être difficile à comprendre.

Langues prises en charge par Google Traduction

Depuis juin 2022, Google Traduction prend en charge les 133 langues suivantes.

  1. Afrikaans
  2. Aymara
  3. Albanais
  4. Allemand
  5. Amharique
  6. Arabe
  7. Arménien
  8. Assamese
  9. Azéri
  10. Bambara
  11. Bengali
  12. Bhojpuri
  13. Biélorusse
  14. Birman
  15. Bosniaque
  16. Bulgare
  17. Cambodgien
  18. Canara
  19. Catalan
  20. Cebuano
  21. Tchèque
  22. Chichewa
  23. Chinois (Simplifié)
  24. Chinois (traditionnel)
  25. Cingalais
  26. Coréen
  27. Corse
  28. Haïtien
  29. Croate
  30. Danois
  31. Dogri
  32. Slovaque
  33. Slovène
  34. Espagnol
  35. espéranto
  36. Estonien
  37. Brebis
  38. Basque
  39. Finnois
  40. Français
  41. Frison
  42. Gaélique écossais
  43. Gallois
  44. Galicien
  45. Géorgien
  46. Grec
  47. Guarani
  48. Gujarâtî
  49. Hausa
  50. Hawaïen
  51. Hébreu
  52. Hindi
  53. Hmong
  54. Hongrois
  55. Igbo
  56. Ilocano
  57. Indonésien
  58. Anglais
  59. Irlandais
  60. Islandais
  61. Italien
  62. Japonais
  63. Javanais
  64. Kazakh
  65. Kiñaruanda
  66. Kirghiz
  67. Konkani
  68. Krio
  69. Kurde (Kurmanji)
  70. Kurde (Sorani)
  71. Lao
  72. Latine
  73. Letton
  74. Lingala
  75. Lituanien
  76. Luganda
  77. Luxembourgeois
  78. Macédonien
  79. Maithili
  80. Malayalam
  81. Malaisien
  82. Maldivien
  83. Malgache
  84. Maltais
  85. Maori
  86. Marathi
  87. Meiteilon (Manipuri)
  88. Mizo
  89. Mongol
  90. Néerlandais
  91. Népalais
  92. Norvégien
  93. Oriya
  94. Oromo
  95. Punjabi
  96. Pachtoune
  97. Perse
  98. Polonais
  99. Portugais
  100. Quechua
  101. Roumain
  102. Russe
  103. Samoan
  104. Sanskrit
  105. Sepedi
  106. Serbe
  107. Sotho du Sud
  108. Shona
  109. Sindhi
  110. Somali
  111. Swahili
  112. Suédois
  113. Soundanais
  114. Tagalog
  115. Thaï
  116. Tamil
  117. Tatar
  118. Tadjik
  119. Telugu
  120. Tigrigna
  121. Tsonga
  122. Turc
  123. Turkmène
  124. Twi
  125. Ukrainien
  126. Ouïghour
  127. Urdu
  128. Ouzbek
  129. Vietnamien
  130. Xhosa
  131. Yiddish
  132. Yoruba
  133. Zoulou

Langues en développement et version bêta de Google Traduction

Les langues suivantes ne sont pas encore prises en charge par Google Traduction, mais vous pouvez contribuer à ces langues via le site Web pour que Google puisse les prendre en charge à l’avenir. En juin 2022, 103 langues sont en développement, dont 9 en version bêta.

Les langues bêta sont plus proches de leur sortie publique et ont une option supplémentaire exclusive pour contribuer qui vous permet d’évaluer jusqu’à 4 traductions de la version bêta en traduisant un texte anglais de 50 caractères maximum.

  1. Achène
  2. Adyghé
  3. Afar BETA
  4. Ahirani
  5. Sud de l’Altaï
  6. Aragonais
  7. Avar
  8. Bagheli
  9. Baloutche
  10. Bangala
  11. Baoulé
  12. Bachkir
  13. Tuf Batak
  14. Betawi
  15. Bodo BÊTA
  16. Breton
  17. Kashmiri
  18. Cantonais
  19. Chatisgarí
  20. Tchétchène
  21. Cherokee
  22. Chiluba
  23. Chitonga
  24. Chittagonio
  25. Tchouvache
  26. Cumuco
  27. Decaní
  28. Dholuo
  29. Diula
  30. Dzongkha
  31. Edo
  32. Efik
  33. Esan
  34. Fon
  35. Fulfulde BETA
  36. Gagaúzo
  37. Garhwali
  38. Groenlandais
  39. Haryanvi
  40. Hiligainon
  41. Inuktitut
  42. Isoko
  43. Khakasium
  44. Kamba
  45. Kanouri
  46. Karachai-Balkaro
  47. Karakalpak
  48. Kashgai
  49. Kikuyu
  50. Kokborok
  51. Lakota
  52. Luba
  53. Madurés
  54. Magahi
  55. Malais de Kedah
  56. Malais de Kelantan
  57. Marvari
  58. Mazandaraní
  59. Minangkabau
  60. Monténégrin
  61. Mossi
  62. Navajo
  63. Ndébélé du Sud
  64. Népal bhasa BETA
  65. Occitan
  66. pampangan
  67. Pidgin, Nigéria
  68. K’iche
  69. Rangpuri
  70. Rayastani
  71. Rohingya
  72. Romanche
  73. Sadri
  74. Sel
  75. Sami du Nord
  76. Samogitien
  77. Sango
  78. Santali BETA
  79. Saraiki BETA
  80. Serrano
  81. Tswana
  82. Chor
  83. Sicilien
  84. Swahili du Congo
  85. Suryapuri
  86. Sylheti
  87. Tamazight BETA
  88. Tatar de Sibérie
  89. BÊTA tibétain
  90. Tiv
  91. Tok pisin
  92. Tswa
  93. Khorasan Turc
  94. Tuvinian
  95. Urhobo
  96. Urrumano
  97. Varhadi-Nagpuri
  98. Bandage
  99. Wolof
  100. Iakoute
  101. Yucatèque BETA
  102. Zazaki
  103. Zhuang

Licences et composants open source

LangueWordNetLicence
EspagnolEspagnolCC-BY 3.0/GPL 3
ArabeWordnet arabe
CatalanRéférentiel central multilingueCC-BY-3.0
ChinoisWordnet chinoisWordnet
DanoisSylvainPas de Wordnet
EspagnolRéférentiel central multilingueCC-BY-3.0
FinnoisFinnWordnetWordnet
FrançaisWOLF (WOrdnet Libre du Français)CeCILL-C
GalicienRéférentiel central multilingueCC-BY-3.0
HébreuWordnet hébreuWordnet
HindiIIT Bombay WordnetIndo Wordnet
IndonésienWordnet BahasaMit
AnglaisPrinceton WordnetWordnet
ItalienMultiWordnetCC-BY-3.0
JaponaisWordnet japonaisWordnet
JavanaisWordnet javanaisWordnet
MalaisienWordnet BahasaMit
NorvégienWordnet norvégienWordnet
PerseWordnet persanUtilisation gratuite
PolonaisplWordnetWordnet
PortugaisOpenWN-PTCC-BY-SA-3.0
ThaïWordnet thaïlandaisWordnet

Commentaires

Peu de temps après le lancement du service de traduction, Google a remporté un concours international pour la traduction automatique anglais-arabe et anglais-chinois.

Erreurs de traduction et bizarreries sur Google Traduction

Étant donné que Google Traduction utilise la correspondance statistique pour traduire, le texte traduit peut parfois inclure des erreurs flagrantes et des phrases apparemment dénuées de sens, en utilisant des termes communs pour des termes communs similaires mais non équivalents dans la langue cible, comme avec la traduction latine, inversant ou modifiant le sens de la phrase demandée.

Le 23 avril 2020, il a été annoncé qu’il avait adopté un nouveau modèle pour réduire les préjugés sexistes qui se produisent entre deux langues, lorsque l’une d’elles fait la distinction entre homme et femme dans les termes neutres de l’autre.

Références (sources)


Catégories