
Photo d’illustration Greg Baker/AFP
Thomas Edison, l’opérateur télégraphique autodidacte devenu entrepreneur, est souvent considéré comme le plus grand inventeur de tous les temps, tandis que Nikola Tesla, qui a travaillé pour une société Edison à Paris avant d’émigrer aux États-Unis, est à peine connu, sauf à travers la société de véhicules électriques d’Elon Musk. Pourtant, c’est la percée de Tesla dans le domaine du courant alternatif, et non la technologie du courant continu d’Edison, qui a rendu l’électrification de masse abordable. Les coûts prohibitifs du courant continu auraient fait de l’électrification urbaine d’Edison un jouet pour les riches, comme nombre de ses autres inventions.
Les modèles d’IA DeepSeek de l’investisseur chinois Liang Wenfeng pourraient-ils représenter une percée similaire dans ce domaine, ou sont-ils des escroqueries comme la fusion froide et la supraconductivité à température ambiante ? Et s’ils sont confirmés, les États-Unis doivent-ils les considérer comme une menace mortelle ou comme un bienfait pour le monde ?
Comme de nombreuses technologies transformatrices, l’IA a évolué pendant de nombreuses décennies avant que le lancement de ChatGPT par OpenAI à la fin de l’année 2022 ne déclenche la frénésie actuelle. De meilleurs algorithmes, des appareils complémentaires tels que les téléphones portables et des systèmes informatiques en nuage moins chers et plus puissants ont permis de généraliser l’utilisation de la technologie, mais sans qu’on s’en aperçoive. Les essais et les erreurs ont montré où l’IA pouvait ou ne pouvait pas surpasser l’effort et le jugement humains.
Illusion
La désinvolture magique de ChatGPT et d’autres grands modèles de langage (LLM en anglais) a créé l’illusion que l’IA générative était une toute nouvelle percée. ChatGPT comptait un million d’utilisateurs dans les cinq jours suivant sa sortie, et 300 millions d’utilisateurs hebdomadaires deux ans plus tard. Des géants de la haute technologie comme Microsoft, Meta et Alphabet ont parié des milliards de dollars sur des produits d’IA et des centres de données, oubliant rapidement leur enthousiasme antérieur pour la réalité virtuelle et augmentée.
En 2024, Nvidia, qui avait investi 2 milliards de dollars dans sa puce d’IA Blackwell, a vu sa capitalisation boursière être multipliée par neuf en deux ans. Son directeur général, Jensen Huang, a prédit que 1 000 milliards de dollars seraient investis dans des centres de données utilisant de telles puces au cours des prochaines années. L’approche prudente et attentiste d’Apple à l’égard de l’IA semblait alors démodée.
Peu importe que la nouvelle IA n’ait pas apporté aux utilisateurs finaux une valeur à la mesure de l’investissement monumental (sans parler de sa demande insatiable d’électricité). Les investissements ont continué à croître en partant du principe que les centres de données à grande échelle réduiraient les coûts de l’IA et qu’une utilisation accrue rendrait les modèles plus intelligents.
Mais sous leurs nouveaux capots étincelants, les LLM, comme de nombreux modèles d’IA vieux de plusieurs décennies, utilisent toujours la reconnaissance des formes et les prédictions statistiques pour produire leurs résultats, ce qui signifie que leur fiabilité repose sur le fait que l’avenir ressemble au passé. Il s’agit là d’une limitation importante. Les humains peuvent interpréter de manière imaginative les données historiques pour anticiper ce qui pourrait se passer différemment dans le futur ; ils peuvent également améliorer leurs prédictions en discutant de manière imaginative les uns avec les autres. Les algorithmes d’IA ne le peuvent pas.
« Moment Spoutnik »
Mais ce défaut n’est pas fatal. Comme les processus qui obéissent aux lois de la nature sont naturellement stables, l’avenir ressemble au passé à bien des égards. Même si le processus sous-jacent est instable – ou si le retour d’information est ambigu –, les prédictions statistiques peuvent être plus rentables que le jugement humain. Les publicités qui ne correspondent pas à la réalité et qui sont diffusées par les algorithmes de Google ou de Meta restent supérieures à celles qui sont diffusées à l’aveugle. Dicter des textes sur un téléphone portable peut produire des erreurs, mais c’est toujours plus rapide et plus pratique que de pianoter sur un petit écran.
En 2022, des innovateurs ingénieux avaient découvert d’innombrables cas où l’intelligence artificielle basée sur les statistiques était suffisamment bonne, voire meilleure, que les alternatives reposant sur le jugement humain. À mesure que le matériel informatique et les logiciels s’améliorent, les cas d’utilisation rentables ne peuvent que se multiplier. Mais il était illusoire de penser que les LLM représentaient un grand pas en avant simplement parce qu’ils pouvaient converser comme des humains. D’après mon expérience personnelle, les applications LLM sont loin d’être inutiles pour effectuer des recherches, produire des résumés ou générer des graphiques.
Néanmoins, les rapports sur les prouesses de DeepSeek ont provoqué une onde de choc sur les marchés financiers. DeepSeek affirme avoir atteint des performances d’IA dignes d’OpenAI et de Google en utilisant uniquement des puces Nvidia bas de gamme et pour une fraction des coûts de formation et d’exploitation. Si c’est le cas, la demande de puces d’IA haut de gamme sera plus faible que prévu. C’est pourquoi la nouvelle concernant DeepSeek a effacé environ 600 milliards de dollars de la capitalisation boursière de Nvidia en une seule journée.
Certes, les affirmations de DeepSeek peuvent se révéler inexactes. De nombreuses affirmations de Tesla concernant ses inventions après sa percée dans le domaine du courant alternatif ont été largement exagérées, voire frauduleuses, et la machine de propagande soviétique a régulièrement fabriqué des percées scientifiques et technologiques à côté de progrès réels. Mais les innovations frugales et originales peuvent être transformatrices. Il suffit de regarder les fusées réutilisables à bas prix de Musk. La mission martienne réussie de l’Inde n’a coûté que 73 millions de dollars, soit moins que le budget du film de science-fiction hollywoodien Gravity.
Si elle est confirmée, la technologie de DeepSeek pourrait être aux LLM ce que les inventions de Tesla en matière de courant alternatif ont été à l’électrification. Bien qu’elle ne puisse pas surmonter les limites inévitables des modèles statistiques rétrospectifs, elle pourrait rendre leur performance en termes de prix suffisamment bonne pour une utilisation plus large. Ceux qui développent des modèles LLM n’auront plus à dépendre des subventions fournies par les grands opérateurs qui ont intérêt à les bloquer. Des modèles moins gourmands en ressources pourraient réduire la demande de centres de données ou contribuer à orienter leur capacité vers des utilisations plus justifiables sur le plan économique.
Qu’en est-il de la géopolitique ? L’investisseur en capital-risque Marc Andreessen a qualifié l’arrivée de DeepSeek de « moment Spoutnik de l’IA ». Le président américain Donald Trump estime que le modèle chinois d’IA est un « signal d’alarme pour les industries américaines », qui devraient « se concentrer sur la concurrence pour gagner ». Il a annoncé son intention d’imposer de nouveaux droits de douane sur les importations de semi-conducteurs en provenance de Chine, et son prédécesseur avait imposé des contrôles à l’exportation sur les puces d’IA haut de gamme.
Il est erroné de considérer les avancées transformationnelles à l’étranger comme une menace pour le bien-être national. La recherche aveugle d’un leadership technologique ou scientifique est une entreprise insensée. Ce qui importe le plus, c’est la volonté et la capacité des entreprises et des consommateurs à développer et à utiliser des produits et des technologies issus de la recherche de pointe, d’où qu’elle vienne. Il en va de même pour les modèles d’IA à code source ouvert de DeepSeek.
Bien entendu, nous devons contrôler les utilisations militaires menaçantes des technologies occidentales de pointe par des régimes hostiles. Mais il s’agit là d’un défi différent et difficile à relever. S’il était possible de le relever par le biais de contrôles des exportations, nous aurions cessé depuis longtemps de nous inquiéter des armes nucléaires nord-coréennes ou iraniennes.
Project Syndicate, 2025.
Par Amar BHIDÉ
Professeur de politique de santé à la Mailman School of Public Health de l’université de Columbia. Dernier ouvrage : « Uncertainty and Enterprise » (Oxford University Press, 2024).