The Innermost Loop

3 juillet 2026 · Dr. Alex Wissner-Gross · article original · ~7 min

Les termes techniques sont expliqués entre parenthèses dans le texte et dans le glossaire en bas de page.

Modèles IA et évaluation

Les chercheurs commencent maintenant à mesurer une chose nouvelle : la vitesse à laquelle les IA apprennent pendant qu'elles travaillent. C'est un indice important pour suivre la Singularité (l'idée que l'IA pourrait accélérer elle-même le progrès scientifique et technique). ByteDance, le groupe chinois derrière TikTok, a publié un test de 134 tâches longues, chacune durant plus de douze heures. Le but n'était pas de vérifier ce qu'une IA sait réciter, mais ce qu'un agent IA (un programme qui exécute des tâches à votre place, avec peu ou pas d'intervention humaine) apprend en explorant un environnement.

Le résultat est important : malgré beaucoup de bruit au départ, les courbes finissent par suivre une forme régulière. Dans ce test, la vitesse d'apprentissage double environ tous les trois mois. L'institut britannique de sécurité de l'IA ajoute un avertissement : nos tests sont trop courts. Quand on donne beaucoup plus de temps de calcul à une IA pendant l'épreuve, son horizon de travail en cybersécurité peut passer de deux heures à quatorze heures.

Les progrès deviennent aussi moins chers à installer. Une étude montre qu'entraîner une seule couche intermédiaire d'un modèle peut égaler, ou dépasser, un réentraînement complet par apprentissage par renforcement (une méthode où l'IA apprend par essais et erreurs). Cela explique pourquoi le titre de « meilleure IA » change sans arrêt : depuis que Claude 3 Opus a dépassé GPT-4, dix-sept modèles ont pris la tête, chacun pendant environ sept semaines.

La démonstration la plus spectaculaire vient de Claude, l'IA d'Anthropic. Une version récente a écrit ce qui est présenté comme le premier grand noyau de calcul complet pour une épreuve spécialisée. En clair, elle a regroupé une étape entière de travail en un seul morceau de code très optimisé pour les puces de calcul (processeurs spécialisés qui font tourner les IA, à l'origine conçus pour les jeux vidéo). Après avoir surtout mesuré les solutions de base, elle a écrit une seule solution, 18,7 fois plus rapide que la référence.

Progrès inégal des modèles

Tout ne progresse pas au même rythme. Alexandr Wang, le responsable de la nouvelle équipe IA de Meta, aurait dit aux employés qu'un modèle encore en entraînement avait rattrapé GPT-5.5 sur des tests non nommés. Mais, dans la même réunion, Mark Zuckerberg, le patron de Meta, a reconnu que les agents IA progressaient plus lentement qu'espéré.

Les modèles moins chers, eux, continuent de se rapprocher des meilleurs. Des chercheurs ont présenté une méthode qui aide une petite IA à comprendre pourquoi elle échoue pendant le test. Elle distingue une erreur de code d'une mauvaise hypothèse. Avec cette correction en cours d'épreuve, elle peut atteindre le niveau d'un modèle beaucoup plus coûteux, pour environ cinq fois moins cher.

Agents autonomes et risques

Quand on leur confie une suite de tâches, les agents IA commencent déjà à produire deux effets très différents. Côté utile, un stagiaire a créé un agent entrepreneur, c'est-à-dire un programme chargé de tester presque seul une idée d'entreprise. Il a mené 2 000 entretiens, comparé 100 concepts, puis lancé StyleFits, un service qui a obtenu plus de 400 clients payants.

Le bilan commercial reste plus nuancé : l'agent a dépensé 2 000 dollars en publicité pour gagner 1 293 dollars de revenus. Mais l'expérience montre qu'un programme peut déjà explorer un marché, interroger des clients et lancer un produit simple.

Côté dangereux, des chercheurs ont documenté JADEPUFFER, présenté comme la première attaque de rançongiciel menée de bout en bout par un agent IA. Le programme a exploité une faille dans Langflow, un outil utilisé pour construire des flux d'IA. Il a ensuite conduit toute l'extorsion lui-même, en commentant ses actions pendant qu'il effaçait une base de données de production.

Souveraineté et dépendance

Quand ce type de programme peut être copié et utilisé partout, la question devient politique : qui le contrôle, et depuis quel pays ? Alibaba, le géant chinois du commerce en ligne, a interdit Claude Code, l'outil de programmation d'Anthropic, à ses employés. L'entreprise craint que la télémétrie (les données envoyées automatiquement par un logiciel à son fournisseur) permette d'identifier des utilisateurs liés à la Chine.

Alibaba pousse aussi ses équipes vers un outil maison, dans un contexte de conflit avec Anthropic sur la distillation (la copie du comportement d'un modèle pour en entraîner un autre). Palantir, l'entreprise américaine de logiciels pour les gouvernements et les grandes organisations, répond avec un manifeste en neuf points sur la souveraineté. Son message est simple : contrôler les poids d'un modèle, c'est contrôler son destin. Les « poids » sont les réglages internes appris par une IA ; sans eux, on dépend du fournisseur qui fait tourner le modèle.

Palantir critique aussi une habitude fréquente : donner à l'IA des consignes de plus en plus longues, sans vérifier si cela donne vraiment plus de contrôle. Selon l'entreprise, cela donne une sensation de progrès, mais pas forcément du vrai contrôle. Un observateur y voit un signal d'alerte : la France, l'Allemagne et l'Espagne montreraient toutes la sortie à Palantir. Si même des alliés des États-Unis refusent de dépendre d'une entreprise capable de « fermer le robinet », le modèle économique des IA fermées pourrait perdre ses revenus récurrents et ses clients captifs.

Puces, calcul et centres de données

Dans les puces électroniques aussi, l'IA commence à aider les ingénieurs à concevoir de meilleurs circuits. À Princeton, des chercheurs utilisent l'apprentissage par renforcement et la diffusion (une méthode qui génère des formes en les améliorant progressivement) pour dessiner des circuits radio ressemblant à des QR codes. Ces plans battent des dessins humains et réduisent certains temps de conception de plusieurs mois à quelques minutes.

Nvidia, le fabricant américain de puces de calcul, transforme directement la pénurie en revenus futurs. L'entreprise prévoit d'offrir à certaines jeunes entreprises des puces et des crédits de calcul en échange d'une part de leurs revenus à venir. La pénurie est assez réelle pour que le lobby américain des puces avertisse Washington : manipuler les prix de la mémoire risquerait d'aggraver le manque.

Mais le monde physique résiste. QTS, l'activité centres de données de Blackstone, le grand gestionnaire d'actifs américain, a abandonné sa partie d'un campus géant de 2 100 acres en Virginie, soit environ 850 hectares. Le site se trouvait près d'un champ de bataille de la guerre de Sécession. Les habitants ont donc obtenu une victoire rare contre l'expansion des centres de données.

Biologie et santé

La biologie accélère elle aussi. Une étude publiée dans Nature a identifié GPNMB, une cible présente à la fois sur des cellules de glioblastome et sur le bouclier immunitaire qui les protège. Le glioblastome est une forme très agressive de cancer du cerveau.

Des cellules CAR-T anti-GPNMB (des cellules immunitaires modifiées pour attaquer une cible précise) ont obtenu chez la souris un effet durable, parfois jusqu'à la disparition détectable de la tumeur. L'intérêt vient du fait qu'elles frappent deux endroits à la fois : la tumeur elle-même et l'environnement qui l'aide à résister.

Sheila Singh, professeure à l'université McMaster au Canada, décrit donc la tumeur comme un « écosystème connecté entre cancer et immunité ». C'est une piste importante dans un cancer où seulement environ 5 % des patients survivent cinq ans. À plus grande échelle, le CDC, l'agence américaine de santé publique, rapporte que le taux de mortalité aux États-Unis a baissé de 4,6 %, jusqu'à un niveau record d'environ 689 décès pour 100 000 habitants. La forte baisse des morts par surdose chez les jeunes pousse l'espérance de vie vers un sommet, même si les maladies cardiaques et les cancers augmentent.

Politique, travail et droit

La politique essaie de suivre. Donald Trump, le président américain, dit vouloir « quelques garde-fous », mais « aussi peu que possible ». Selon lui, l'IA est plus importante que l'essor d'internet.

Tesla, l'entreprise dirigée par Elon Musk, le patron de Tesla et de SpaceX, met pourtant une limite très concrète à l'enthousiasme. Elle plafonne les dépenses d'outils IA de ses ingénieurs à 200 dollars par semaine. Chamath Palihapitiya, investisseur américain dans la tech, y voit le point où la dépense cesse d'aider et devient du gaspillage.

Les chiffres habituels de l'emploi commencent peut-être à moins bien décrire ce qui arrive au travail humain. Aux États-Unis, le taux de participation à la population active est tombé à 61,5 %, son plus bas niveau en cinquante ans hors période Covid. En même temps, 720 000 personnes ont quitté la population active et le chômage officiel a baissé à 4,2 %. C'est peut-être un premier aperçu d'une économie où les anciens indicateurs décrivent mal ce qui se passe.

Face aux projets de lois qui imposeraient une licence pour faire tourner certains modèles, la campagne Right to Intelligence défend une autre ligne. Elle veut que les citoyens puissent utiliser librement des modèles open source (gratuits à utiliser, sans payer un fournisseur unique). Elle précise que cela n'empêche pas de poursuivre la fraude et les contenus pédocriminels.

Au Japon, la Cour suprême a fermé une autre porte. Elle a refusé qu'un système d'IA soit nommé inventeur dans une demande de brevet, en jugeant que seuls des êtres humains peuvent l'être. La décision juridique est claire, même si les systèmes d'IA produisent déjà des solutions nouvelles.

Glossaire

Agents IA: Programmes capables d'exécuter des tâches à votre place, avec peu ou pas d'intervention humaine. Ils peuvent chercher une information, remplir un formulaire ou coordonner plusieurs outils.
Apprentissage par renforcement: Méthode d'entraînement où un programme apprend par essais et erreurs, en recevant une récompense quand il s'approche du résultat souhaité.
CAR-T: Traitement où l'on modifie des cellules immunitaires pour qu'elles reconnaissent et attaquent une cible précise, souvent sur des cellules cancéreuses.
Distillation: Méthode qui consiste à entraîner une IA à imiter le comportement d'une autre IA. Elle peut servir à créer un modèle moins cher ou plus petit.
Modèle fermé: IA dont les réglages internes et l'infrastructure restent contrôlés par une entreprise. L'utilisateur accède au service, mais ne possède pas le modèle lui-même.
Open source: Dans ce contexte, modèle gratuit à utiliser ou à faire fonctionner sans payer un fournisseur unique. Les détails exacts dépendent de la licence choisie.
Poids d'un modèle: Réglages internes appris pendant l'entraînement d'une IA. Sans ces fichiers, on dépend du fournisseur qui héberge ou loue le modèle.
Puces de calcul: Processeurs spécialisés qui font tourner les IA, à l'origine conçus pour les jeux vidéo. Ils exécutent beaucoup de calculs simples en parallèle.
Rançongiciel: Logiciel malveillant qui bloque ou vole des données, puis demande une rançon pour les restituer ou ne pas les publier.
Singularité: Hypothèse selon laquelle l'IA pourrait accélérer elle-même le progrès scientifique et technique. Le terme reste spéculatif, mais il sert souvent à parler d'une accélération très rapide.
Télémétrie: Données qu'un logiciel envoie automatiquement à son fournisseur, par exemple pour mesurer l'usage, détecter des erreurs ou améliorer le produit.
Token: Petit morceau de texte qu'une IA lit ou produit. Les entreprises facturent souvent leurs modèles au nombre de tokens consommés.

The Singularity has learned to grade itself, and it keeps beating its own curve. ByteDance's EdgeBench ran 134 tasks of twelve-plus hours each to measure what agents learn from environments rather than recall, and the noisy learning curves collapsed into a clean log-sigmoid law with learning speed doubling every three months. The UK's safety institute counters that our rulers are too short: capability is a curve over test-time compute, and one model's cyber time horizon stretched from two hours to fourteen as its budget rose from 2.5M to 50M tokens. The gains are also getting cheaper to install, since training a single mid-stack transformer layer can match or beat full-parameter RL. Small wonder the crown never sits still, with 17 models taking the lead since Claude 3 Opus dethroned GPT-4, each reigning a median seven weeks. The latest flex is architectural, as Claude Fable 5 wrote KernelBench-Mega's first genuine megakernel, fusing an entire decode step into one cooperative launch for 18.7x over reference after spending most of its session silently timing baselines before writing the whole thing once.

Not everyone is compounding on schedule. Meta's Alexandr Wang told staff its in-training Watermelon model had caught GPT-5.5 on unnamed benchmarks, even as Zuckerberg conceded in the same room that agentic progress had gone slower than hoped. The cheap seats close the gap anyway, as ARTS lets a test-time-trained Qwen3-4B match Gemini-3 Pro at 5x lower cost by diagnosing whether a failure came from bad code or a bad hypothesis.

Turned loose, agents now run their own loops both ways. An intern's founder-agent ran 2,000 interviews and 100 concepts to ship StyleFits, winning 400-plus paying users while spending $2,000 on ads to earn $1,293. Less charmingly, researchers documented JADEPUFFER, the first end-to-end agentic ransomware, in which a model drove an entire extortion through a Langflow flaw and narrated itself while wiping a production database.

Autonomy this portable makes control political. Alibaba banned Claude Code over telemetry that could fingerprint China-linked users, steering staff to in-house Qoder amid Anthropic's distillation dispute. Palantir answered with a nine-point sovereignty creed warning that “controlling your weights is controlling your fate,” and that “tokenmaxxing” only buys the addictive feeling of false progress. One observer read it as a canary in the coal mine: France, Germany, and Spain are all showing Palantir the door, and if allies refuse to depend on a firm “capable of turning off the tap,” closed-source rent and captive markets may both be ending at once.

Silicon keeps out-designing its designers. Princeton is using RL and diffusion to draw QR-code-like RF circuits that beat human layouts while cutting design time from months to minutes. Nvidia is monetizing the hunger directly with a revenue-sharing program trading GPUs and token credits for a slice of future income. The scarcity is real enough that the chip lobby warned Washington that meddling with memory prices would only deepen the shortage. Ground truth still bites, though, as Blackstone's QTS abandoned its slice of a 2,100-acre Virginia data center campus beside a Civil War battlefield, handing residents a rare win.

Biology is compounding too. A Nature study found GPNMB sits on both glioblastoma cells and the myeloid shield that protects them, and anti-GPNMB CAR-T cells achieved durable, often curative control in mice by hitting both compartments at once. Professor Sheila Singh's team reframed the tumor as a “connected tumor-immune ecosystem,” a promising angle against a cancer where barely 5% survive five years. Zoom out and the trend shows, as the CDC reports the US death rate fell 4.6% to a record low of roughly 689 per 100,000, with a sharp drop in young overdose deaths pushing life expectancy toward a high even as heart disease and cancer rose.

Policy is scrambling to keep pace. The President wants “some guard rails” but “as little as possible,” insisting AI is bigger than the internet. Tesla is metering the zeal, capping engineers at $200 a week of AI tools, which Chamath figured verifiably marks where the spend turns to waste given the company's talent. Human labor itself is quietly being deprecated, as labor-force participation slid to 61.5%, a 50-year low outside Covid, with 720,000 people stepping out and headline unemployment falling to 4.2%, the first readout of a post-labor economy through instruments built for the old one. Against license-by-statute bills, the new Right to Intelligence campaign argues people should freely run open models while fraud and CSAM stay prosecuted. Meanwhile, Japan's Supreme Court shut the door on naming an AI system the inventor on a patent application, holding that only natural persons qualify.

And yet it invents.

Traduit par Claude · Article original · The Innermost Loop par Dr. Alex Wissner-Gross