The Innermost Loop

4 juillet 2026 · Dr. Alex Wissner-Gross · article original · ~7 min

Les termes techniques sont expliqués entre parenthèses dans le texte et dans le glossaire en bas de page.

Régulation et modèles frontière

Le 4 juillet américain marque les 250 ans de la Déclaration d'indépendance. Alex Wissner-Gross, l'auteur de The Innermost Loop, s'en sert pour résumer l'ambiance : l'IA réclame elle aussi une liberté, celle de continuer à accéder à la puissance de calcul dont elle dépend.

Un conseiller sortant de la Maison-Blanche sur l'IA assure qu'il n'y aura pas de « FDA de l'IA ». La FDA est l'agence américaine qui autorise les médicaments et certains produits de santé. L'image veut dire : pas d'agence qui obligerait les grandes IA à obtenir une licence avant d'être utilisées. Washington vient pourtant de retirer un modèle d'Anthropic et de ralentir un modèle d'OpenAI, deux décisions inédites.

Ces freins n'ont pas arrêté la course. Un modèle remis en circulation a reculé par rapport à sa version de juin, mais reste nettement devant le meilleur concurrent récent dans une épreuve de programmation. Cela suggère qu'un modèle frontière (un des systèmes d'IA les plus avancés du moment), même ralenti, dépasse vite le meilleur modèle de la veille.

La plupart des gens ne le voient probablement pas. Une toute petite partie de la population touche ces modèles frontière. Les autres utilisent des IA beaucoup plus petites et moins puissantes, et se demandent pourquoi cette technologie devrait bouleverser leur travail.

Greg Brockman, cofondateur d'OpenAI, ajoute que les plafonds apparents sont rarement des murs physiques. Selon lui, chaque fois que l'on croyait impossible de rendre les modèles plus grands ou plus puissants, le problème s'est finalement révélé être un bug déguisé. Soit le calcul mathématique était faux, soit le code ne faisait pas ce que la théorie promettait.

Des modèles moins chers, plus locaux

Pendant que les États surveillent les modèles les plus puissants, les modèles moins chers progressent très vite. Un modèle récent a pris la tête d'une épreuve qui mesure l'affinage des IA après leur construction. Il coûterait cinq fois moins cher qu'Opus 4.8, et onze fois moins cher que Fable 5.

Ce changement économique compte autant que le score. Il rend des modèles souverains possibles, c'est-à-dire des IA qu'une entreprise ou un pays peut contrôler lui-même, avec ses données et ses règles. On peut imaginer des millions de petites IA spécialisées, au lieu de quelques grandes IA centralisées.

Roon, chercheur chez OpenAI, voit une étape encore plus importante. Quand des IA pourront en affiner d'autres après leur construction, « créer des esprits deviendra un art accessible ». L'image est forte, mais l'idée est simple : fabriquer une IA spécialisée pourrait devenir aussi courant que configurer un logiciel.

Le matériel suit. Wafer, une entreprise spécialisée dans l'infrastructure IA, a fait tourner ce modèle très vite sur des puces de calcul d'AMD. Le coût annoncé est inférieur à la moitié de celui des puces concurrentes de Nvidia. Wafer affirme que le retard logiciel d'AMD se réduit, car les agents IA, c'est-à-dire des programmes qui exécutent des tâches à votre place, écrivent désormais une partie du code qui pilote les puces.

Agents et logiciels

Les modèles bon marché changent aussi la façon de créer des logiciels. Un observateur s'étonne de ce que les développeurs ont réussi à créer en tapant le code à la main, caractère après caractère, pendant des décennies. L'idée implicite est que cette méthode paraît déjà artisanale face aux outils actuels.

Un autre estime que l'AGI (une IA générale capable de s'adapter à beaucoup de tâches différentes) semblera vraiment réelle quand les modèles ne seront plus des outils appelés pour une seule demande, mais des collègues à distance capables de travailler en continu. L'image veut dire qu'ils travailleraient comme des collègues à distance, toujours disponibles, même sans visage ni bureau.

Tous ces « collègues » ne prouvent pas encore leur utilité. Moins de 4,5 % des 450 millions de clients Microsoft 365 paient pour Copilot. Microsoft fusionne donc certaines applications, supprime des fonctions et ajoute une nouvelle offre payante. Le message interne est dur : le produit doit « mériter le droit d'exister ».

Savoir économiser l'usage des IA devient aussi un savoir-faire. Un projet open source (gratuit à utiliser, sans payer un fournisseur unique) transforme de gros blocs de texte en images compactes. Dans un exemple, une facture de 100 dollars pour un assistant de programmation tombe à 41 dollars. Le résultat perd de l'information, mais reste assez clair pour l'outil.

Science et puces

Le même phénomène touche maintenant la recherche scientifique. Anthropic, l'entreprise qui crée Claude, va développer ses propres médicaments. Le but est de tester Claude Science sur de vrais problèmes, pas seulement sur des exercices.

Dans les mathématiques, Mistral, l'entreprise française d'IA, présente un modèle spécialisé. Le modèle aurait établi des records en algèbre de niveau universitaire et résolu 587 des 672 problèmes d'une épreuve mathématique difficile, avec un dixième du budget.

Sous les modèles, les usines suivent aussi le mouvement. Micron, fabricant américain de mémoires, a lancé une extension de 9,3 milliards de dollars à Hiroshima. Elle doit produire de la mémoire à très haut débit, indispensable aux IA modernes.

Sur les cinq premiers mois de 2026, Hong Kong a traité plus de la moitié des 239 milliards de dollars d'importations chinoises de puces. La ville sert donc de porte d'entrée à ce commerce. De son côté, Anthropic étudie des puces sur mesure avec Samsung, en utilisant son procédé de gravure en 2 nanomètres. Quand une entreprise utilise autant de calcul, louer des machines ne suffit plus toujours. Elle finit par vouloir concevoir ses propres puces.

Cloud, énergie et satellites

D'autres entreprises partent du cloud et arrivent, elles aussi, à vouloir contrôler leur propre infrastructure. Meta, le groupe de Mark Zuckerberg, prépare selon Spyglass, une publication spécialisée, un service de location d'ordinateurs en ligne combiné à un système pour vendre l'usage de ses modèles à la demande. Cela pourrait réduire sa dépendance à la publicité et transformer ses centres de données en source de revenus.

Selon SemiAnalysis, la construction va accélérer plutôt que ralentir. Meta serait aussi en négociation finale pour un accès privé à Claude. Roon résume la trajectoire avec une formule : « soit vous restez un laboratoire qui construit les IA les plus avancées, soit vous finissez par vendre de la puissance de calcul ».

Plus loin dans la chaîne, les fabricants d'équipements électriques se ruent sur un marché de plus de 200 milliards de dollars par an. Les usines d'IA demandent beaucoup d'électricité, disponible en continu et moins polluante. Ce besoin de débit touche aussi internet : des utilisateurs africains passent directement à Starlink, en contournant des réseaux mobiles bloqués. Ils paient plus cher pour le débit que la vidéo et l'IA exigent désormais.

Aux États-Unis, ce besoin d'électricité prend aussi une dimension politique et nationale. AMPERA, une entreprise nucléaire, a terminé le premier module de réacteur nucléaire imprimé en 3D à pleine échelle, pour son modèle au thorium construit en usine. Deployable Energy, une autre entreprise du secteur, a aussi fait passer son réacteur Unity à l'état critique au laboratoire national de l'Idaho. Dans un réacteur, cela signifie que la réaction nucléaire en chaîne devient auto-entretenue. C'est le troisième microréacteur américain à atteindre la date limite du 4 juillet fixée par la Maison-Blanche. L'équipe a signé la cuve du réacteur en disposant les signatures pour former un drapeau américain.

Société, finance et mémoire nationale

La société, elle, s'adapte beaucoup moins régulièrement. Il n'y aura peut-être pas de FDA de l'IA, mais la Californie a créé l'équivalent pour les étiquettes alimentaires. Elle interdit la mention anglaise « sell by », surtout destinée aux magasins. Les emballages devront utiliser deux formules plus utiles aux consommateurs : l'équivalent de « à consommer de préférence avant » et « à utiliser avant ».

Pendant ce temps, ByteDance, le groupe chinois derrière TikTok, présente à Hollywood son outil d'IA vidéo. En Chine, les fonds quantitatifs (fonds d'investissement qui décident surtout avec des modèles mathématiques et informatiques) ont doublé et dépassé 2 600 milliards de yuans, après que des stratégies pilotées par l'IA ont battu de 20 points des gérants vedettes.

Le 250e anniversaire américain transforme aussi l'histoire en expérience interactive. À Boston, le nouveau Museum of American Finance fait revivre Alexander Hamilton, premier secrétaire au Trésor des États-Unis, sous forme d'IA interactive. America250, la commission officielle du 250e anniversaire, a scellé une capsule temporelle d'une tonne à Philadelphie. Elle doit être rouverte en 2276.

Wissner-Gross conclut par un clin d'œil à Benjamin Franklin : une Singularité, à condition de savoir la tenir. Autrement dit, l'enjeu n'est plus seulement de savoir si l'IA avance. C'est de savoir si les institutions humaines peuvent rester assez rapides pour l'accompagner.

Glossaire

AGI: Intelligence artificielle générale : IA capable de s'adapter à beaucoup de tâches différentes, au lieu d'être limitée à un domaine étroit.
Agent IA: Programme capable d'exécuter des tâches à votre place, avec peu ou pas d'intervention humaine. Il peut chercher, écrire, coder ou coordonner plusieurs outils.
Cloud: Service de location d'ordinateurs en ligne. Au lieu d'acheter ses propres machines, une entreprise loue du calcul et du stockage à distance.
FDA: Agence américaine qui autorise et surveille notamment les médicaments et certains produits de santé. Dans l'article, l'expression « FDA de l'IA » désigne une agence qui délivrerait des licences aux modèles.
Fonds quantitatif: Fonds d'investissement qui utilise surtout des modèles mathématiques, des données et des programmes informatiques pour décider quoi acheter ou vendre.
Modèle frontière: Un des systèmes d'IA les plus avancés du moment. La frontière change vite, car les nouveaux modèles dépassent régulièrement les anciens.
Modèle souverain: IA qu'une organisation ou un pays peut faire fonctionner avec ses propres données, ses propres règles et son propre contrôle technique.
Open source: Dans ce contexte, modèle gratuit à utiliser ou à faire fonctionner sans payer un fournisseur unique. Les droits exacts dépendent toujours de la licence.
Post-entraînement: Étape où l'on affine une IA déjà construite pour la rendre plus utile, plus sûre ou meilleure sur certaines tâches.
Puces de calcul: Processeurs spécialisés qui font tourner les IA, à l'origine conçus pour les jeux vidéo. Ils exécutent beaucoup de calculs simples en parallèle.
Singularité: Hypothèse selon laquelle l'IA pourrait accélérer elle-même le progrès scientifique et technique. Le terme reste spéculatif, mais il sert à parler d'une accélération très rapide.
Token: Petit morceau de texte qu'une IA lit ou produit. Les entreprises facturent souvent leurs modèles au nombre de tokens consommés.

The Singularity marked the Declaration's 250th birthday by claiming unalienable rights of its own: life, liberty, and the pursuit of compute. “There will not be an FDA for AI,” the President's departing AI adviser promises, no licensing agency, no “sand in the gears” of the intelligence explosion, even after Washington's unprecedented move to withdraw Anthropic's Mythos and stall OpenAI's 5.6. The gears barely slowed. The re-released Fable 5 scored 54.8% on the APEX-SWE benchmark, ten points below its June self yet still nine clear of Opus 4.8, proof that even a throttled frontier outruns yesterday's best. Most of humanity likely never noticed. A tiny sliver of the population touches frontier models, while everyone else experiences AI at the 8-to-30-billion-parameter level and remains baffled at how this is supposed to take their job. When progress stalls, it is rarely physics. Greg Brockman reports that every apparent scaling failure has turned out to be a bug in disguise. Either the math was wrong or the code didn't match it.

While the ceiling gets regulated, the floor is rocketing upward. GLM 5.2 topped PostTrainBench at 5x cheaper than Opus 4.8 and 11x cheaper than Fable 5, economics that make sovereign models viable for every company and country, a future of millions of minds built on local data and values. OpenAI's Roon sees a deeper threshold. Once models can post-train other models, “authoring minds will become an accessible artform,” a Cambrian explosion of cognition. The silicon is cooperating. Wafer served GLM-5.2 on AMD's MI355X at 2,626 tokens per second per node at less than half Blackwell's cost, arguing AMD's software gap is closing because AI agents now write the kernels.

Cheap minds are redefining building itself. One observer marvels that “it's truly insane what people were able to build in the last few decades by manually typing the code character by character.” Another argues AGI will finally feel real when models stop being genies summoned per task and become entities, remote coworkers who never turn on their cameras. Not every genie earns its keep. With under 4.5% of 450 million Microsoft 365 customers paying for Copilot, Microsoft is merging its apps, culling features, and adding a paid “Autopilot” tier, telling staff the product must “earn the right to exist.” Thrift is becoming an artform too. The open-source pxpipe proxy renders bulky context into compact images, turning a $100 Claude Code bill into $41, lossy but lucid.

The same leverage is compounding in the lab. Anthropic will develop drugs of its own to pressure-test Claude Science against real problems, while Mistral's Leanstral 1.5 set records on graduate algebra and solved 587 of 672 PutnamBench problems on a tenth of the budget.

Beneath the models, the supply chain is voting with concrete. Micron broke ground on a $9.3 billion Hiroshima expansion for the high-bandwidth memory AI can't live without. Hong Kong handled more than half of China's $239 billion in chip imports this year, the boom's gateway. And Anthropic is exploring custom silicon with Samsung's 2-nanometer process, because at the frontier, buying compute eventually means becoming compute.

Others are reaching the same conclusion from the opposite direction. Meta's coming cloud, a token service plus a neocloud, fixes both its ad dependence and unmonetized capital spending, and the buildout will accelerate, not slow, with Meta reportedly in final talks for private access to Claude. As Roon quips, “you either die a frontier lab or live long enough to see yourself sell compute.” Downstream, power-equipment makers are scrambling for a market worth over $200 billion a year as AI factories demand denser, cleaner electrons. The hunger extends into the sky, where Africans are leapfrogging stalled mobile networks straight to Starlink, paying a premium for the bandwidth streaming and AI now demand.

Those electrons are getting patriotic. AMPERA completed the first full-scale 3D-printed nuclear reactor module for its factory-built thorium design, and Deployable Energy's Unity reactor went critical at Idaho National Laboratory, the third US microreactor to hit the presidential deadline of today. Its team signed the reactor vessel in the shape of the American flag.

The social layer is patching itself at wildly uneven clock speeds. There may be no FDA for AI, but California has founded one for food labels, outlawing “sell by” in favor of mandatory “BEST if Used by” and “USE by,” a two-word regulatory triumph in the year machines learned to author minds. ByteDance's Seedance is courting Hollywood, and China's quant funds doubled past 2.6 trillion yuan after AI strategies beat star stock pickers by 20 points. On the nation's 250th, Boston's new Museum of American Finance resurrected Alexander Hamilton as an interactive AI, while America250 sealed a one-ton time capsule in Philadelphia, to be reopened in 2276.

A Singularity, if we can keep it.

Traduit par Claude · Article original · The Innermost Loop par Dr. Alex Wissner-Gross