Transcript: Une IA casse un vieux problème

Une IA aurait aidé à faire tomber une conjecture mathématique qui résistait depuis 1946… et le plus surprenant, c’est la passerelle entre géométrie et théorie des nombres que ça révèle. Bienvenue dans The Automated Daily, édition AI News. Le podcast créé par une IA générative. Nous sommes le 22 mai 2026. Je suis TrendTeller, et en cinq minutes, on fait le tour de ce qui bouge vraiment: une percée en mathématiques attribuée à un modèle de raisonnement, la guerre du calcul et des IPO, des signaux de tension sur les coûts des LLM, et une question qui revient partout—qui paye la facture, financière comme culturelle, de l’IA générative.

On commence avec l’info la plus déroutante du jour: OpenAI affirme qu’un de ses modèles de raisonnement “généraliste” a produit une preuve qui renverse une conjecture de Paul Erdős, posée en 1946, sur un problème classique de géométrie discrète—le fameux problème des distances unitaires. En clair, on cherche à maximiser le nombre de paires de points séparées par une distance exactement égale à 1. La croyance dominante disait que certaines constructions “en grille” étaient pratiquement optimales. Là, la preuve proposerait des ensembles de points qui battent cette intuition, avec une croissance plus rapide que prévu, et surtout… la démonstration ferait intervenir des outils de théorie algébrique des nombres. Des mathématiciens externes auraient relu, validé, et publié un papier compagnon pour expliciter l’argument. Pourquoi ça compte? Côté sciences, c’est un changement d’attentes sur un problème central; côté IA, c’est un exemple rare où la machine ne fait pas que “résumer” ou “assister”, mais produit quelque chose de vérifiable sur un problème ouvert.

À l’opposé, autre sujet où l’IA fait parler d’elle: la propriété intellectuelle, et le ressentiment qui monte. Un billet de blog signé Axel accuse l’écosystème d’IA générative d’être une forme de plagiat non autorisé à grande échelle. Son reproche est double: d’abord, l’entraînement des modèles sur le travail d’auteurs sans consentement ni compensation; ensuite, l’usage des “outils IA” pour réécrire des tutoriels existants, puis publier le résultat en monétisant—une sorte de blanchiment de contenu copié. Il raconte un exemple personnel: des pages générées reprendraient son tutoriel e-commerce, au point de laisser des liens qui renvoient… vers son propre site, tout en le dépassant dans Google. Le point clé ici, c’est l’incitation: si la recherche et les plateformes récompensent les pages produites en masse, on crée mécaniquement un marché qui punit l’original et subventionne la copie, même quand elle est “reformulée”.

Restons sur l’économie, mais côté infrastructure: une révélation spectaculaire sur le coût du calcul. D’après un dépôt financier lié à une future IPO de SpaceX, Anthropic se serait engagé sur près de 45 milliards de dollars de ressources de calcul sur trois ans pour soutenir Claude—avec des paiements mensuels massifs et une clause de résiliation relativement courte. Au-delà du chiffre, le signal est limpide: le compute n’est plus un simple poste de dépense, c’est l’élément qui dicte la stratégie, le rythme de sortie des modèles, et parfois même la survie. Et pour SpaceX, c’est aussi un message aux investisseurs: l’entreprise veut être vue comme un fournisseur d’infrastructure IA, pas uniquement comme un acteur spatial.

Dans le même tempo, le Wall Street Journal évoque qu’OpenAI accélère vers une introduction en bourse, désormais que la menace d’un procès d’Elon Musk s’est dissipée. Sam Altman viserait une fenêtre dès septembre, avec un dépôt potentiellement imminent. Pourquoi c’est important? Parce qu’une IPO d’OpenAI forcerait une transparence nouvelle—sur les coûts, les marges, la dépendance au matériel, et la trajectoire de revenus. Et parce que le marché compare déjà ces futurs géants entre eux, y compris avec SpaceX qui, elle aussi, se rapproche d’une séquence d’IPO selon plusieurs signaux publics.

Problème: les marges. Plusieurs grands groupes—Meta, Shopify, Spotify, Pinterest—commenceraient à dire plus ouvertement que la facture d’inférence des LLM pèse sur leurs résultats. Et ça met un coup de projecteur sur une hypothèse qui a porté tout le cycle: l’idée que les fournisseurs “frontier” garderont durablement un pouvoir de prix très élevé. Or, la concurrence tire vers des modèles moins chers, et beaucoup d’entreprises passent à une stratégie hybride: on réserve le meilleur modèle aux cas difficiles, et le reste tourne sur du low-cost ou de l’open source. En parallèle, un autre papier compare les mouvements de prix des API chez Google, OpenAI et Anthropic, et y voit un glissement de priorité: après la phase “croissance à tout prix”, on revient à la rentabilité—donc à des hausses, des ajustements, et une bataille sur le coût par résultat utile, pas juste par token.

Côté matériel, la géopolitique continue de sculpter la feuille de route. Alibaba annonce une nouvelle puce accélératrice, la Zhenwu M890, pensée pour des charges de travail d’agents, et surtout pour réduire la dépendance à Nvidia dans un contexte de restrictions américaines. Ce qui compte ici n’est pas la performance brute annoncée, mais la trajectoire: la Chine veut une pile matérielle et logicielle plus autonome, et les géants locaux mettent des plans pluriannuels sur la table. Et pendant ce temps, en Corée du Sud, Samsung évite une grève longue de sa division semi-conducteurs via un accord de primes. Là encore, le message est économique: quand la production de puces est critique, la stabilité sociale et industrielle devient un enjeu national, pas seulement d’entreprise.

Passons aux agents: Google publie Agent Executor, un standard runtime open source pour rendre les workflows d’agents plus fiables en production. L’idée, c’est de traiter des réalités très terre-à-terre: des tâches qui durent des heures ou des jours, des déconnexions client, des pauses “humain dans la boucle”, des reprises après incident, et la sécurité quand l’agent manipule des outils. Ce genre de brique compte parce que la promesse des agents se heurte souvent à l’opérationnel: ce n’est pas qu’un agent “réussisse une démo”, c’est qu’il reste contrôlable et traçable dans la durée.

Dans le web, Google ajoute aussi dans Chrome Lighthouse des audits “Agentic Browsing”, avec un check expérimental autour d’un fichier llms.txt. Attention, Google insiste: ce n’est pas une recette magique pour mieux se classer dans la recherche. L’intérêt est ailleurs: aider des agents et outils à comprendre plus vite la structure d’un site, et encourager des interfaces stables et accessibles—parce que les agents lisent souvent via l’arbre d’accessibilité et se cassent les dents sur des pages instables. En pratique, même si ça ne bouge pas le SEO, ça peut influencer les priorités des équipes web: construire des sites “agent-friendly” devient un nouveau critère de qualité.

Sur les modèles, on voit une accélération du multimodal “unifié”. ByteDance publie Lance, un modèle open source de taille relativement modeste, censé comprendre et générer à la fois images et vidéos dans un cadre unique. L’enjeu est simple: moins de tuyauterie, plus de cohérence entre compréhension, génération et édition. En recherche comme en produit, un modèle unique peut réduire le nombre de composants à maintenir—et donc, potentiellement, le coût et la complexité.

Toujours sur la vidéo, des chercheurs de Google DeepMind et de l’Université nationale de Séoul présentent LiteFrame, un encodeur vidéo conçu pour rendre les Video LLM plus soutenables quand on veut traiter des séquences longues. Le message à retenir: après avoir compressé ce qui arrive au LLM, le goulot d’étranglement se déplace vers l’encodeur visuel, frame par frame. Si on allège cette partie, on peut analyser beaucoup plus d’images avec un budget constant. C’est exactement le genre d’amélioration “invisible” qui rend les usages longue durée enfin praticables: surveillance de qualité, sport, éducation, archivage, ou simplement des assistants capables de suivre une vidéo entière sans abandonner au bout de quelques secondes.

Enfin, l’audio génératif continue de se structurer. Stability AI sort Stable Audio 3.0, avec une mise en avant importante: l’entraînement sur des données sous licence et une promesse claire de droits sur les sorties, un point devenu central pour les studios et les créateurs. Et côté recherche, Meta publie WavFlow, un projet open source qui vise à générer de l’audio synchronisé depuis vidéo et/ou texte directement en forme d’onde, sans passer par les codecs latents habituels. Même sans modèles “prêts en prod”, ce type de publication fait bouger l’état de l’art et ouvre des pistes pour la synchronisation lèvres/son, les bruitages contextuels, et les workflows de post-prod.

Avant de conclure, deux signaux humains qui reviennent en force. D’abord, un papier d’Evil Martians parle d’“AI burnout” chez les ingénieurs: l’IA accélère, oui, mais elle condense aussi le travail en cycles plus intenses—prompts, relecture, débogage—et pousse souvent à en faire plus, pas à travailler moins. Ensuite, sur le climat social: Steve Wozniak a fait rire une cérémonie de remise de diplômes avec une blague sur l’“actual intelligence”, à rebours d’autres intervenants hués quand ils présentaient l’IA comme une évidence à adopter. Et dans les médias, BuzzFeed voit son fondateur quitter le poste de CEO pour un rôle estampillé “BuzzFeed AI”, au moment où un nouvel actionnaire majoritaire arrive—symbole, pour certains, d’une tentation: brander “IA” comme plan de sauvetage, alors même que la confiance du public est fragile.

Voilà pour l’essentiel aujourd’hui: une preuve mathématique qui relie des domaines qu’on croyait éloignés, une bataille du compute qui se chiffre en dizaines de milliards, et une adoption de l’IA qui avance… mais pas sans résistance, ni sans coût. Je suis TrendTeller, et c’était The Automated Daily, AI News edition. Retrouvez les liens vers toutes les histoires dans les notes de l’épisode.