L’ajout de l’inuktut à Google Traduction s’inscrit dans le cadre d’une initiative débutée en 2020 visant à créer un modèle de langage basé sur l’intelligence artificielle pour prendre en charge les 1000 langues les plus parlées au monde.
Selon Statistique Canada, approximativement 40 000 Canadiens parlent l’inuktut.
Un long travail de développement
La première étape du développement de cet outil consistait à évaluer la faisabilité au niveau de la technologie et plus spécifiquement, de voir s’il était possible de bâtir un modèle qui reconnait l’inuktut.
«Après avoir déterminé cela, un long processus de consultation et d’ajustement du modèle est nécessaire afin d’optimiser la qualité de la traduction avant le lancement», résume Isaac Caswell, ingénieur principal chez Google Traduction.
Un groupe d’experts et de locuteurs natifs de divers dialectes régionaux ont d’abord été consultés.
Puis, l’Inuit Tapiriit Kanatami (ITK) a conseillé Google sur la qualité de la traduction et sur le système d’écriture utilisé pour la langue.
Lancé sur le site web d’ITK le 19 octobre 2022, cet outil convertit le texte orthographique régional tapé ou copié et collé dans des dialectes tels que l’inuinnaqtun ou inversement.
Le travail de Google Traduction s’appuie donc sur ce travail important entrepris par ITK au cours des dernières années pour unifier leur langue et la préserver pour les générations futures.
Enfin, ITK a offert son soutien à Google dans la mise à disposition de la langue, ce qui a permis de procéder au lancement.
Dans un échange de courriel, l’organisation indique avoir collaboré avec Google pendant trois ou quatre mois et espère à présent maintenir une relation avec eux.
Une langue complexe
Google se donne comme mission de rendre l’information mondiale universellement accessible et utile, ce qui comprend envers les personnes de toutes les communautés et les locuteurs de toutes les langues, et non seulement les langues les plus parlées au monde.
Au cours de l’histoire de Google Traduction, plusieurs demandes ont été formulées pour que l’inuktut et d’autres langues autochtones des Amériques soient représentées.
«Nous choisissons les langues en fonction de l’intérêt de la communauté et de la faisabilité technologique. La communauté inuit est également relativement importante, bien organisée et de plus en plus présente en ligne, ce qui signifie que nous disposions d’une grande quantité de matériel et d’expertise pour développer notre modèle linguistique», déclare Isaac Caswell.
Par sa variété de dialectes avec leurs propres caractéristiques, sa grammaire polysynthétique et son système d’écriture unique, l’inuktut demeure difficile à traduire et représente un défi de taille pour les modèles d’intelligence artificielle.
Bien que l’équipe de Google ait tenté d’améliorer la précision autant que possible, l’entreprise reconnait qu’il y aura encore beaucoup d’erreurs.
«Nous considérons cela comme une première étape, et à mesure que nous recevrons des commentaires et que notre technologie s’améliorera, la qualité de la traduction s’améliorera également», conclut Isaac Caswell.