Contexte : Plus les modèles IA gagnent d'utilisateurs, plus ils ont besoin de puissance de calcul. Or cette puissance est limitée, chère, et déjà réservée... pour tout 2026 ! On a déjà vu ce scénario avec les chemins de fer et le boom d'internet : la demande explose plus vite que l'infrastructure capable de la supporter.
Du coup les boites rationnent : OpenAI a supprimé son modèle vidéo Sora en partie pour libérer de la puissance de calcul, lancé un abonnement à 100$/mois et plafonné les sessions des utilisateurs Plus. Anthropic limite désormais les tokens pendant les heures de pointe (8h à 14h heure de New York en semaine). Google a limité l'accès gratuit à Gemini 3…
Et Anthropic a un problème : Son chiffre d'affaires a plus que triplé en quelques mois, mais c'est une boite bien plus petite qu'OpenAI, avec moins de capacité à investir massivement dans l'infrastructure. Résultat : des utilisateurs frustrés par des limites strictes et des pannes fréquentes qui poussent certains clients entreprises vers la concurrence.
On risque de faire face à une pénurie car :
1) Construire un data center prend des années et coûte des milliards.
2) Leur entrée en bourse qui permettrait d’obtenir ces milliards, dépend de marges solides, mais investir massivement dans l'infrastructure détruit ces marges à court terme...
Et 3) pendant ce temps, de plus en plus de villes bloquent les projets de data centers en cours…
Et si l'offre est structurellement limitée, alors les entreprises vont se battre pour y avoir accès... et les entreprises qui en auront deviendront également beaucoup plus attractives pour les talents.