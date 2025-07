Microsoft va investir plusieurs millions de dollars en Europe pour produire des données numériques à destination des modèles d'intelligence artificielles (IA) dans plus d'une dizaine de langues, a annoncé lundi à l'AFP son président.

Alors que les principaux modèles d'IA sont en grande partie entrainés en anglais, leurs bases de données doivent proposer davantage de sources dans d'autres langues, sans quoi la survie de celles-ci « est en jeu », a défendu Brad Smith lors d'un entretien à l'AFP. Un modèle « est moins performant lorsqu'il est utilisé dans une langue pour laquelle les données sont insuffisantes », a-t-il rappelé, ce qui peut pousser les utilisateurs à favoriser l'anglais.

Dès septembre, le géant américain de la tech compte installer à Strasbourg (est de la France) des antennes de ses centres de recherche pour notamment « étendre la disponibilité des données » dans au moins 10 des 24 langues officielles de l'Union européenne, comme l'estonien et le grec.

Le groupe de Redmond (Etat du Washington) compte par exemple aider à la numérisation de livres en langue non-anglaise et faire enregistrer des centaines d'heures d'audio dans différents langages. « Microsoft ne possédera aucune de ces données » qui seront « accessibles au grand public » et disponibles en source ouverte, a assuré Brad Smith.

Alors que la question de la souveraineté numérique européenne agite le monde de la politique et de la tech depuis plusieurs mois, le géant américain cherche à se positionner comme l'entreprise la plus compatible avec le marché européen. En juin, il avait par exemple annoncé renforcer sa coopération avec les gouvernements de l'UE en matière de cybersécurité et de nouvelles mesures de contrôle sur les données stockées dans ses centres en Europe. « Nous nous engageons sans réserve à défendre la souveraineté et les données européennes », a de nouveau martelé Brad Smith.

Si la plupart des géants de l'IA sont américains et chinois, l'Europe abrite quelques pépites du secteur comme le français Mistral et la start-up franco-américaine Hugging Face, plateforme d'IA en accès libre. Des initiatives européennes, comme TildeLM, cherchent aussi à développer des modèles d'IA pour les langues européennes.

Microsoft a également annoncé lundi la création à l'automne d'une réplique numérique de la cathédrale Notre-Dame de Paris, en partenariat avec l'Institut du Patrimoine et l'entreprise française Iconem, dont elle fera don à l'Etat français. Il a également lundi dévoilé des partenariats avec la Bibliothèque national de France (BNF) et le Musée des arts décoratifs visant à numériser une partie de leurs collections.