Contexte : Les labos d'IA ont épuisé toutes les données publiques disponibles sur internet. Problème : ces données ne sont pas suffisantes pour entraîner des agents IA capables de vraiment travailler. Il faut des données de travail réel (des Slack, des emails, des Google Docs…)
Du coup un nouveau business fleurit : liquider les données des startups mortes. SimpleClosure, une startup spécialisée dans la fermeture d'entreprises, vend les archives numériques de sociétés défuntes à des labos d'IA. En un an : près de 100 transactions, plus d'1M$ récupérés pour des fondateurs, entre 10 000 et 100 000$ par entreprise.
Le cash arrive : Anthropic envisage de dépenser 1Md$ cette année pour s'entraîner sur ce type de données.
Comment savoir ce qui a de la valeur ? Eh bien un message Slack qui dit "j'ai corrigé le bug" vaut peu. Mais ce même message lié à la ligne de code modifiée, ça, c'est de l'or pour un labo d'IA. Plus les données racontent une histoire complète de comment le travail s'est fait, mieux c’est.
Ce qui m’empêche de dormir du coup c’est que les boites anciennes que personne ne voulait, viennent de x10 leur valorisation. Imaginez seulement la quantité de datas qu’elles ont accumulé depuis 20-30-50 ans. On peut s’attendre à un rachat massif de vieilles boites, dans le seul but de posséder la data et de la revendre. L’arbitrage (coût d’achat de l’entreprise et revente de la data interne) pourrait créer des petites fortunes.