in

Fatigué de vos fautes de frappe, Bing étend les corrections orthographiques à plus de 100 langues

Microsoft souhaite rendre ses capacités de recherche beaucoup plus inclusives et efficaces pour ses utilisateurs. La société a annoncé ses dernières mesures visant à améliorer la correction orthographique pour plus de 100 langues.

La société affirme que 15% des requêtes de recherche contiennent des fautes d’orthographe, ce qui affecte directement la qualité des résultats pour les utilisateurs. La nouvelle technologie, Speller100, est une tentative de résoudre ce hoquet linguistique avec un amalgame impressionnant d’intelligence artificielle, d’apprentissage zéro-shot, de recherche et de théorie linguistiques.

Qu’est-ce que l’apprentissage zéro-shot: pour rendre la correction orthographique sophistiquée, Microsoft a implémenté une configuration de dépannage complexe appelée apprentissage zéro-shot. Dans ce type d’approche de solution, la machine doit prédire les catégories correctes pour les échantillons tout en étant entraînée sur des ensembles de données textuelles. Selon Microsoft, l’apprentissage zéro-shot est particulièrement utile dans la formation linguistique, car il «permet à un modèle d’apprendre et de corriger l’orthographe avec précision sans données d’apprentissage étiquetées spécifiques à la langue».

«Imaginez que quelqu’un vous apprenne à écrire en anglais et que vous appreniez automatiquement à écrire en allemand, néerlandais, afrikaans, écossais et luxembourgeois aussi», explique la société. “C’est ce qui permet un apprentissage sans tir, et c’est un composant clé de Speller100 qui nous permet de nous étendre dans des langues avec peu ou pas de données.”

Gérez les erreurs comme un pro – Dans l’itération de correction orthographique de Microsoft, les utilisateurs travaillent essentiellement avec une machine qui gère les erreurs comme un problème de séquence à séquence. Microsoft dit qu’il s’est inspiré du problème de recherche sur l’IA de Facebook et a décidé d’appliquer la résolution de problèmes complexes à sa machine de correction orthographique. Inclus, nuancé et étonnamment pédagogique.

Ce qui rend les récents changements de Microsoft encore plus intéressants, c’est qu’ils plongent dans l’histoire de la langue. L’approche de résolution de problèmes implique la compréhension de l’ancêtre de la langue commune pour plusieurs langues et comment leur orthographe – la façon dont les mots sont orthographiés et d’autres règles d’une langue – relie une langue à une autre. Par exemple, l’anglais présente des similitudes orthographiques avec les langues germaniques. Due en anglais signifie “twee” en néerlandais, “zwei” en allemand et “zwee” en luxembourgeois. Le sang est “sanglant” en néerlandais et en afrikaans, “Blut” en allemand et “Blutt” en luxembourgeois.

Obtenez la dérive. Cela rend la correction orthographique beaucoup plus pratique et l’apprentissage des langues beaucoup plus amusant.