The Innermost Loop

16 juin 2026 · Dr. Alex Wissner-Gross · article original · ~5 min

Les termes techniques sont expliqués entre parenthèses dans le texte et, plus en détail, dans le glossaire en bas de page.

Un prix pour les tokens d'IA

On savait déjà mesurer le prix de la puissance de calcul qui fait tourner l'IA. On ne savait pas encore mesurer le prix des tokens qu'elle produit (les petits morceaux de texte qu'une IA lit ou écrit lorsqu'elle répond). Cela change aujourd'hui.

Plus tôt cette année, Alex Wissner-Gross avait raconté le moment où la puissance de calcul sur GPU (puces de calcul, à l'origine conçues pour les jeux vidéo) est devenue une classe d'actifs négociable. Ornn, l'entreprise qu'il a aidé à créer et qu'il conseille, avait lancé un indice du prix du calcul, puis des contrats à terme sur ce calcul.

Mais le calcul n'est que l'entrée du système. Ce que l'économie de l'IA mesure, vend et budgète vraiment, c'est le token d'inférence (petit morceau de texte lu ou produit par une IA lorsqu'elle répond). Jusqu'ici, ce token n'avait pas de prix de marché fiable.

Pourquoi une unité commune compte

Une marchandise ne peut pas être correctement cotée tant que son unité n'est pas fixée. En août 1866, des producteurs de pétrole se sont réunis à Titusville, en Pennsylvanie. Ils ont décidé qu'un baril contiendrait 42 gallons, soit environ 159 litres.

Avant cela, le pétrole circulait dans des tonneaux de tailles différentes, par exemple 40 ou 45 gallons. Les contrats ne parlaient donc pas toujours de la même chose. Pour l'IA, le token joue déjà le rôle du baril : c'est l'unité que les laboratoires utilisent pour facturer. Ce qui manquait encore, c'était le prix réel.

Les prix affichés par les fournisseurs sont publics. Mais aucun grand acheteur ne paie exactement ce tarif. Les rabais, la mise en cache (réutiliser une partie d'une réponse déjà calculée), la différence entre tokens d'entrée et de sortie, et le choix entre plusieurs modèles changent le coût final.

L'auteur compare cela au pétrole. Pendant des décennies, les grandes compagnies annonçaient un prix officiel du brut. Quand elles l'ont baissé unilatéralement, en 1959 puis en août 1960, les pays producteurs se sont réunis à Bagdad en septembre 1960 et ont fondé l'OPEP. Un prix affiché est une déclaration. Un prix réellement payé révèle ce que le marché accepte vraiment.

Ce que lance Ornn

Ornn lance les Ornn Token Price Indices, abrégés OTPI. Ce sont les premiers indices qui donnent un prix aux tokens des grands laboratoires d'IA de pointe à partir de vraies transactions payées, et non à partir des grilles tarifaires publiques.

Au lancement, OTPI publie des indices quotidiens séparés pour Anthropic, l'entreprise qui développe Claude, et OpenAI, l'entreprise qui développe ChatGPT. Pour chacune, l'indice combine tous les modèles selon le volume réel de tokens payés. Le résultat est un prix en dollars par million de tokens.

Pour une entreprise, cela aide à budgéter ses dépenses d'IA. Pour un investisseur, cela donne un signal sur la demande réelle. Pour un laboratoire, cela permet de comparer la manière dont il gagne de l'argent avec ses tokens à celle du marché.

Une vieille idée appliquée à l'IA

L'idée d'un indice de prix n'est pas nouvelle. William Fleetwood, un évêque et économiste anglais, a posé en 1707 l'un des premiers raisonnements modernes sur les indices de prix. Il voulait comprendre si une limite de revenu de 5 livres, fixée au XVe siècle dans un statut d'Oxford, avait encore le même sens plusieurs siècles plus tard.

Plus tard, Adam Smith, l'économiste écossais auteur de La Richesse des nations, a repris ces données. Fleetwood pouvait comparer des prix moyens, mais il ne savait pas encore pondérer les biens selon leur importance. Au XIXe siècle, Étienne Laspeyres et Hermann Paasche ont ajouté cette pondération.

OTPI fonctionne autrement. Il calcule un prix moyen simple : tout l'argent payé par les clients, divisé par tous les tokens achetés. Il laisse donc le mélange réel des modèles entrer dans le chiffre. Si les clients passent massivement à un nouveau modèle, le prix moyen change et l'indice le montre.

Comme l'indice s'appuie chaque jour sur des centaines de milliards, voire plusieurs milliers de milliards de tokens payés, il ressemble davantage au marché lui-même qu'à un sondage.

Ce que ce prix révèle

OCPI, l'autre indice d'Ornn, mesure le prix de l'entrée : le temps de calcul sur GPU. OTPI mesure la sortie : le coût des tokens produits par ce calcul. Ensemble, les deux indices lisent les deux côtés de la courbe de coût de l'IA.

La question profonde n'est pas seulement de savoir si l'IA est utilisée. Elle est de savoir si les clients continuent à payer pour elle. OpenAI estime que le coût d'un même niveau d'intelligence baisse d'environ 40 fois par an. Mais cela dit ce qu'un token permet d'obtenir, pas le prix que les clients acceptent de payer.

OTPI montre aussi un signal que presque personne ne voit hors des laboratoires : comment les demandes des clients se répartissent entre les différents modèles d'un fournisseur, et à quelle vitesse une nouveauté attire les utilisateurs après son lancement. C'est une indication directe de la demande.

Cette lecture compte parce que près de 7 000 milliards de dollars d'investissements dans les centres de calcul sont projetés d'ici 2030. Tout repose sur l'idée que la demande d'IA sera réelle et durable. Le prix du token est une première mesure dure de cette demande.

Le coût de l'intelligence

Peter Diamandis, entrepreneur américain spécialiste des technologies de rupture, et Alex Wissner-Gross défendent dans Solve Everything une idée simple. Quand l'IA devient moins chère, certaines compétences rares peuvent devenir beaucoup plus disponibles. Mais cette abondance doit être mesurée et cotée avant d'être financée.

Le calcul informatique est passé d'un simple indicateur technique à un marché de contrats à terme. OTPI serait la même première étape pour le coût de l'intelligence. Chaque marchandise qui a alimenté une époque a d'abord eu une unité standard, puis un prix réel.

Le token a passé la première étape quand les laboratoires ont commencé à facturer avec lui. Il passe aujourd'hui la seconde. Pour l'auteur, OTPI révèle enfin ce prix.

OTPI est maintenant disponible pour les abonnés d'Ornn Data, la plateforme de données de marché de l'entreprise, sur data.ornn.com. Le calcul est ce que l'économie de l'IA achète. Les tokens sont ce qu'elle vend. À partir d'aujourd'hui, les deux ont un prix.

Cette édition est informative. Elle ne constitue pas un conseil d'investissement, financier ou de trading. L'auteur précise avoir un intérêt financier dans Ornn.

Glossaire

Classe d'actifs: Catégorie de biens financiers que l'on peut acheter, vendre ou utiliser comme référence de marché, comme les actions, les obligations ou certaines matières premières.
Contrat à terme: Contrat financier qui fixe aujourd'hui le prix d'un achat ou d'une vente dans le futur. Il sert souvent à se couvrir contre les variations de prix.
GPU: Puce de calcul, à l'origine conçue pour les jeux vidéo. Les grands modèles d'IA en utilisent beaucoup, car ces puces font de nombreux calculs en parallèle.
Indice de prix: Chiffre qui résume l'évolution d'un ensemble de prix. Il permet de suivre un marché sans regarder chaque transaction séparément.
Inférence: Moment où une IA déjà entraînée répond à une question ou produit un texte. C'est l'usage quotidien du modèle, par opposition à son entraînement initial.
Mise en cache: Technique qui consiste à réutiliser une information déjà calculée, au lieu de refaire tout le calcul. Cela peut faire baisser le coût réel.
OPEP: Organisation des pays exportateurs de pétrole. Elle a été créée en 1960 par plusieurs pays producteurs pour peser davantage face aux grandes compagnies pétrolières.
Singularité: Hypothèse selon laquelle l'IA pourrait progresser si vite qu'elle transformerait profondément l'économie, la science et la société.
Token: Petit morceau de texte lu ou produit par une IA. Le prix de beaucoup de services IA est calculé en nombre de tokens.

The Singularity has had a price for the compute that powers it, but never one for the tokens that compute produces, until now.

Earlier this year I wrote about the moment GPU compute became a tradable asset class, when Ornn put the Ornn Compute Price Index (OCPI) on the Bloomberg Terminal, and brought the first compute futures to the Intercontinental Exchange. But compute is only the input. What the AI economy meters, sells, and budgets is the inference token, and the token has never had an honest price.

A commodity cannot be priced until its unit is fixed. In August 1866, oil producers met in Titusville, Pennsylvania, and agreed that a barrel would hold 42 gallons; until then crude moved in 40- and 45-gallon casks, and no two contracts matched. The token is already the AI economy's barrel, the unit every lab prices in. What the market still lacks is the price.

Posted model rate cards are public, yet no buyer pays the rate card. The phrase "posted price" is itself an inheritance from oil. For decades the majors declared the price of crude, and when they unilaterally cut it, in 1959 and again in August 1960, the producing states convened in Baghdad that September and founded OPEC. A posted price is a declaration; a transacted price is a discovery. In oil the gap between them was political, a number the sellers chose; in AI it is structural. Caching, the input/output split, provider routing, and the mix of models a buyer chooses mean the rate card and the realized cost have never been the same number.

That changes today.

Ornn, a company I helped form and advise with backing from 021T Capital, is launching the Ornn Token Price Indices (OTPI), the first benchmark to price frontier-lab tokens from real transactions, not posted rate cards. OTPI launches with separate daily indices for the two leading frontier labs by benchmarked capability, Anthropic and OpenAI. Enterprises budgeting AI spend, investors marking the demand thesis, and labs benchmarking their monetization now have one number.

For each lab, OTPI weights every model by transacted token volume into a single daily figure in dollars per million tokens, built from executed, paid inference rather than rate cards. It is a unit-value index, total dollars paid over total tokens bought. Bishop William Fleetwood built the first true price index in 1707 to value a £5 cap in a fifteenth-century Oxford statute, data Adam Smith later borrowed for the Wealth of Nations; he could average prices but not weight them. Laspeyres and Paasche added the weighting in the 1870s, each fixing a basket to isolate pure price. A unit-value index does the reverse, letting the live mix into the number, so it moves with what the market pays. Because every input is paid inference, hundreds of billions to trillions of tokens a day, the number is the market itself, not a survey of it.

OCPI prices the input to the AI economy, the cost of GPU time. OTPI prices the output, the cost of the tokens that compute produces. Together they read both sides of the AI cost curve. The output side holds the deepest question in AI, not whether AI is used, but whether buyers keep paying for it. OpenAI estimates the cost per unit of a given level of intelligence is falling about 40x a year. That is what a token buys, not what it costs. OTPI prices the token, which holds up as buyers climb to the frontier and slips only as the frontier commoditizes. The gap between the two is the real deflation, the half no rate card or capability headline can show. Because it is volume-weighted from transacted traffic, the index carries something nobody outside a lab can see, how a provider's traffic actually splits across its models, and how fast a new release wins that traffic once it ships. That migration, normally a lab's most guarded number, is the demand signal itself. Nearly $7 trillion in data-center investment is projected through 2030 on the bet that demand is real, and a token price is the first hard read on it.

As Peter Diamandis and I argued in Solve Everything, the Intelligence Revolution turns every scarce domain it touches into an abundant one, but abundance has to be priced before it can be financed. Compute went from a benchmark to a futures market. OTPI is the same first step for the cost of intelligence. Every commodity that powered an age had its unit standardized, then its realized price discovered. The token cleared the first gate when the labs began billing by it; today it clears the second. OTPI is the discovery.

OTPI is live now for subscribers of Ornn Data, the company's market data platform. See it at data.ornn.com.

Compute is what the AI economy buys. Tokens are what it sells. As of today, both have a price.

(This post is for informational purposes only and does not constitute investment, financial, or trading advice. Nothing herein is a recommendation to buy, sell, or enter into any transaction involving compute, tokens, derivatives, or any other instrument. Statements about future capabilities and demand are forward-looking and subject to uncertainty, descriptions of methodology are not endorsements of accuracy, and past results are not indicative of future results. I have a financial interest in Ornn.)

Traduit par Claude · Article original · The Innermost Loop par Dr. Alex Wissner-Gross