← Toutes les éditions

The Innermost Loop

28 juin 2026 · Dr. Alex Wissner-Gross · article original · ~8 min
Taille du texte

Les termes techniques sont expliqués entre parenthèses dans le texte et, plus en détail, dans le glossaire en bas de page.

Nouveaux modèles d'IA et modèles ouverts

La Singularité (l'idée que l'IA pourrait accélérer elle-même le progrès scientifique et technique) ressemble moins à une limite atteinte qu'à un horizon qui recule à mesure qu'on avance. Noam Brown, chercheur chez OpenAI, explique que le moment où les progrès ralentissent est désormais « vraiment très loin ». Avec une IA très bien encadrée, les tests pourraient continuer à s'améliorer pendant des semaines avant de plafonner. Autrement dit, ces modèles n'ont pas encore montré toute leur limite.

Nous Research, un laboratoire d'IA, transforme cette profondeur en produit. L'entreprise propose des groupes d'agents IA présentés comme des modèles virtuels (des programmes qui collaborent pour exécuter des tâches à votre place). Elle affirme qu'ils dépassent certains grands modèles privés dans son prochain test interne. C'est intéressant, mais cela reste une mesure produite par l'entreprise elle-même.

En même temps, cette frontière devient moins chère. DeepSeek, laboratoire chinois d'IA, publie un nouveau modèle sous licence MIT, donc beaucoup plus libre à utiliser et à adapter. Un guide des modèles ouverts estime que plusieurs modèles chinois et américains restent proches des meilleurs modèles fermés, surtout pour programmer. Ils gardent depuis dix-huit mois un retard d'environ trois à six mois, mais coûtent beaucoup moins cher.

Tout en haut du marché, le choix devient plus fin. Mikhail Parakhin, directeur technique de Shopify, dit que GPT-5.6 bat Opus presque partout, sauf dans la programmation pure. Il utilise donc deux IA ensemble : Fable 5 écrit le code, tandis que GPT-5.6 lance les expériences. Elon Musk, le patron de Tesla et de SpaceX, affirme de son côté que Grok 4.5 talonne déjà Opus dans ses entreprises.

Cybersécurité et géopolitique

Des outils aussi puissants peuvent servir à construire, mais aussi à attaquer. Anthropic, l'entreprise qui développe Claude, devrait rétablir Fable 5 dans la semaine, quelques jours après avoir rouvert Mythos 5 à des utilisateurs jugés fiables. Le fait même qu'il y ait eu une pause est révélateur : ces modèles sont devenus assez forts en cybersécurité pour inquiéter les autorités.

Cet avantage n'est plus seulement américain. Des systèmes chinois égaleraient déjà Mythos dans certaines tâches de cybersécurité, selon le Wall Street Journal. Pendant que les restrictions américaines à l'exportation se prolongent, l'entreprise chinoise 360 et la société japonaise Sakana lancent leurs propres modèles pour combler le vide.

Un analyste avertit que l'effet réel pourrait être de réveiller la Chine. Si le Parti communiste chinois pense subir des opérations offensives américaines intégrées à des modèles d'IA, il ne croira plus avoir quatre mois de retard. Il pourrait au contraire accélérer brutalement.

Dans ce contexte, le prochain verrou pourrait venir du Pentagone et de la NSA, l'agence américaine chargée du renseignement électronique. Ils doivent encore donner leur feu vert. Un cadre gouvernemental d'évaluation des modèles les plus sensibles est attendu en août. Il pourrait peser sur l'ouverture de Fable 5 et de GPT-5.6 au public.

Coûts, agents et travail quotidien

Les modèles capables de faire exploser une facture peuvent aussi aider à la réduire. Brian Armstrong, le patron de Coinbase, dit avoir presque divisé par deux les dépenses d'IA alors que l'usage augmentait fortement. Il n'a pas freiné les équipes : il a choisi des modèles moins chers par défaut, envoyé chaque demande vers le modèle le moins cher capable d'y répondre correctement, et amélioré la réutilisation des réponses déjà calculées. Dans un cas, cette réutilisation serait passée de 5 % à 60 %.

Aravind Srinivas, le patron de Perplexity, pense que chaque entreprise devra organiser son propre circuit d'usage de l'IA : choisir le bon modèle, le tester dans un espace sûr, puis mesurer ce qu'il apporte vraiment. Le but est de savoir combien de valeur l'IA produit par token (un petit morceau de texte traité par le modèle) et par watt d'électricité.

Les ingénieurs poussent cette logique très loin. Business Insider décrit une méthode où l'on laisse l'IA améliorer en continu les consignes données à l'IA. Le créateur de Claude Code, l'assistant de programmation d'Anthropic, ne rédige même plus ses propres instructions : Claude les prépare pour lui.

Mais ces nouveaux collègues logiciels créent aussi du malaise. Claude Tag, un coéquipier IA d'Anthropic intégré dans les canaux Slack, déroute des salariés de Salesforce, l'entreprise propriétaire de Slack, au moment même où Salesforce en fait la promotion.

La facture reste lourde. Gartner, cabinet d'analyse technologique, prévoit que les coûts d'IA pour coder dépasseront le salaire moyen d'un développeur d'ici 2028. Cela aide à comprendre ces fondateurs qui font tourner six agents IA à la fois, disent produire et publier beaucoup plus vite, mais s'épuisent quand même.

Infrastructure et énergie

Toute cette intelligence dépend d'une infrastructure physique qui peine à suivre. IBM veut faire passer l'informatique quantique au stade industriel. L'entreprise met 2 milliards de dollars dans sa fonderie Anderon, dont la moitié vient de Washington, et promet 9 milliards de plus sur cinq ans pour sa machine Starling prévue en 2029.

La puissance de calcul manque déjà. Google aurait limité l'accès de Meta à ses modèles Gemini, parce que Meta demandait plus de capacité que Google ne pouvait en fournir. Masayoshi Son, le patron de SoftBank, ne croit pas aux centres de données en orbite défendus par Elon Musk. Selon lui, l'électricité ne représente qu'environ 7 % des coûts d'exploitation, et l'orbite arriverait avec dix ans de retard.

L'énergie avance pourtant dans des directions spectaculaires. General Fusion, entreprise canadienne de fusion nucléaire, a triplé la température de son plasma pour atteindre 8,4 millions de degrés Celsius, grâce à une compression mécanique. Les énergies renouvelables ont atteint 30 % de la production d'électricité américaine sur les quatre premiers mois de 2026. Côté capacité installée, le solaire a tout juste dépassé l'éolien.

SpaceX commence aussi à poser un gazoduc de près de 13 kilomètres, surnommé « Starpipe ». Il doit amener du méthane directement vers Starship, la fusée géante de l'entreprise. Même l'industrie spatiale redevient donc une affaire très concrète de tuyaux, d'énergie et de logistique.

Robots et défense

Les progrès ne concernent plus seulement les logiciels : ils arrivent aussi dans les robots et les objets physiques. Un bracelet à 300 dollars appelé ForceBand utilise les signaux musculaires humains pour apprendre aux robots à mieux doser la force de leurs mains. Il atteint 87 % de réussite sur des gestes simples mais difficiles pour une machine : prendre, presser, puis poser.

La production s'accélère aussi. AGIBOT, fabricant chinois de robots humanoïdes, annonce son 15 000e robot. L'entreprise revendique déjà 39 % des livraisons mondiales de robots humanoïdes.

Les machines arrivent également sur le terrain militaire. Taïwan a prévu 6,6 milliards de dollars pour un « bouclier sans équipage ». Le plan comprend 208 200 drones d'attaque à usage unique, ainsi que des navires de surface sans équipage.

Même la police civile expérimente. À Sacramento, en Californie, un drone du shérif a utilisé un aimant pour retirer un couteau de la main d'un suspect avant l'arrivée des policiers au contact. L'opération est présentée comme une première aux États-Unis.

Science et découverte automatisées

La découverte s'automatise elle aussi, vers l'intérieur comme vers l'extérieur. Le problème numéro 870 du mathématicien Paul Erdős aurait été résolu par GPT-5.5-Pro, puis vérifié dans Lean 4, un langage qui oblige à écrire les preuves mathématiques de façon formelle. La démonstration compte 180 000 lignes sans trou laissé volontairement, une échelle que personne n'avait encore formalisée.

Dans un autre domaine, un doctorant travaillant seul affirme avoir fabriqué PAC-832, une molécule expérimentale contre Alzheimer. Elle viserait une cible biologique très précise, appelée GalR1. Ce n'est pas encore un médicament validé. L'exploit montre surtout jusqu'où l'automatisation peut aider une personne seule : son laboratoire aménagé dans un garage utilisait Claude Code pour programmer une partie du travail, avec un robot capable de manipuler des liquides.

À Haïfa, des cliniciens ont utilisé des ultrasons focalisés lors d'un traitement d'environ vingt minutes. Une semaine plus tard, le patient disait ne plus ressentir d'envie d'opioïdes. Et Andrew Siemion, astronome au SETI (un programme qui cherche des signes de civilisations extraterrestres), propose de tamiser un mètre cube de poussière lunaire pour y chercher des débris extraterrestres microscopiques.

La dernière idée de l'auteur est simple : des indices minuscules, cachés dans la poussière lunaire, pourraient peut-être révéler des traces d'une autre civilisation. Autrement dit, les réponses les plus lointaines pourraient se cacher dans des traces minuscules, si nous avons maintenant les outils pour les chercher.

Glossaire

Agent IA
Programme d'IA qui exécute des tâches à votre place, avec peu ou pas d'intervention humaine. Il peut chercher, cliquer, rédiger, comparer ou coordonner plusieurs étapes.
Banc d'essai
Épreuve standardisée qui sert à comparer plusieurs IA. Comme un examen commun, il est utile seulement si les participants ne trichent pas et si la note mesure bien la capacité voulue.
Cloud
Service de location d'ordinateurs en ligne. Au lieu d'acheter des machines, une entreprise loue de la puissance de calcul dans les centres de données d'Amazon, Google, Microsoft ou d'autres.
Lean 4
Langage utilisé pour vérifier des preuves mathématiques. Il force chaque étape à être écrite de manière assez précise pour qu'un ordinateur puisse la contrôler.
Modèle ouvert
Modèle d'IA dont certains éléments sont publics ou gratuits à utiliser, sans dépendre d'un fournisseur unique. Le degré d'ouverture varie beaucoup selon les cas.
Open source
Gratuit à utiliser et à adapter, sans payer un fournisseur. Pour l'IA, l'expression peut couvrir des situations très différentes selon ce qui est vraiment publié.
Puces de calcul
Processeurs spécialisés qui font tourner les IA. Beaucoup viennent du monde des puces graphiques, d'abord conçues pour les jeux vidéo.
SETI
Programme de recherche de signes de civilisations extraterrestres. Il cherche des traces observables, comme des signaux radio ou des objets microscopiques inhabituels.
Singularité
Hypothèse selon laquelle l'IA pourrait progresser si vite qu'elle transformerait profondément l'économie, la science et la société.
Token
Petit morceau de texte traité par un modèle d'IA. Les factures d'IA sont souvent calculées en nombre de tokens lus et produits.

The Singularity has stopped having a ceiling and started having a horizon. OpenAI's Noam Brown notes the plateau "is actually really far out these days," with a well-scaffolded GPT-5.5 able to think for weeks before benchmarks flatten. Nous Research turned that depth into product, exposing mixture-of-agent presets as virtual models that claim to beat Opus 4.8 by 8% and GPT-5.5 by 11% on their own upcoming benchmark. The same frontier is becoming a commodity, fragmenting downward in price, as DeepSeek's MIT-licensed V4-Pro-DSpark folds 1.6 trillion parameters and a 1M context into speculative decoding that sips a tenth the KV cache, and a field guide to open weights crowns DeepSeek, GLM 5.2, MiniMax M3, and Nemotron 3 Ultra as frontier-class coders holding the same three-to-six-month gap they have kept for eighteen months, now at a sliver of the cost. Up top, Shopify's CTO finds GPT-5.6 beats Opus at everything yet still cedes coding to Fable 5, pairing them so Fable writes code while 5.6 runs experiments, and Elon Musk says Grok 4.5 is already nipping at Opus inside SpaceX and Tesla.

Capability this sharp cuts both ways. Anthropic looks set to restore Fable 5 within the week, days after Mythos 5 returned for trusted users, the pause itself a backhanded tribute to real cyber teeth. Those teeth are no longer uniquely American, with Chinese systems reportedly matching Mythos in cybersecurity, and as the export ban drags on, China's 360 ships Tulongfeng and Tokyo's Sakana ships Fugu to fill the Mythos-shaped hole. One analyst warns the real fallout is China waking up, reasoning that a CCP on the receiving end of NSA-embedded offensive operations will stop believing it is four months behind and start sprinting, even as the NSA's own cyber benchmark, due by early August, looks like the gate that finally clears both Fable 5 and GPT-5.6 for the public.

The models that can bankrupt you can also budget for you. Coinbase's Brian Armstrong nearly halved AI spend while usage soared, using cheaper defaults, smarter routing, and warm caches rather than usage caps, in one case dragging a cache hit rate from 5% to 60%. Perplexity's CEO sees every enterprise spinning its own model-harness-sandbox-eval flywheel tuned for token value per watt, while engineers lean into "loop engineering" so completely that Claude Code's creator no longer writes his own prompts, Claude does. Anthropic's Claude Tag, an AI teammate inside Slack channels, has left staff at Slack owner Salesforce confused even as the company promotes it. The bill still looms, as Gartner expects AI coding costs to outrun the average developer's salary by 2028, which helps explain founders running half a dozen agents at once who say they have never worked harder while shipping 100x more and burning out anyway.

All of it runs on a physical plant scrambling to keep pace. IBM is industrializing quantum, seeding its Anderon foundry with $2 billion, half from Washington, and pledging $9 billion more over five years toward its 2029 Starling machine. Compute is so scarce that Google throttled Meta's Gemini access after Meta asked for more than it could spare, and Masayoshi Son is betting against Musk's orbital data centers, asking "What's the point?" when power is barely 7% of operating cost and orbit is a decade too slow. Power is going exotic and abundant anyway, as General Fusion tripled its plasma to 8.4 million degrees by mechanical squeeze alone, renewables reached 30% of US generation with solar overtaking wind, and SpaceX began laying an eight-mile "Starpipe" to pump methane straight to Starship.

Atoms are catching up to bits. A $300 wristband called ForceBand teaches robots force-aware hands from human muscle signals, hitting 87% on pick, squeeze, and place, while AGIBOT rolled out its 15,000th robot already holding a 39% share of humanoid shipments. The machines are taking the field too, as Taiwan budgeted $6.6 billion for an "unmanned shield" of 208,200 one-way attack drones, and in a national first a Sacramento sheriff's drone used a magnet to lift a knife from a suspect's hand before deputies moved in.

Discovery itself is automating, inward and outward. Erdős problem #870 fell to GPT-5.5-Pro, then held up across 180,000 sorry-free lines of Lean 4, a scale no one had formalized before. A lone PhD synthesized PAC-832, the first selective GalR1 antagonist for Alzheimer's, in a garage lab run by Claude Code and a liquid-handling robot. Clinicians in Haifa used focused ultrasound to drop an opioid patient's cravings to zero in 20 minutes, and SETI's Andrew Siemion proposes sifting one cubic meter of lunar regolith for micron-scale alien debris, the nearest place to look for proof we were never alone.

The proof is in the powder.

Traduit par Claude · Article original · The Innermost Loop par Dr. Alex Wissner-Gross