0,075$ le million de tokens, on est passés à autre chose et tout le monde dort encore
vous avez vu les nouveaux prix de Gemini Flash ? 0,075$ le million de tokens en input. C'est moins cher que de stocker un fichier sur S3.
Y'a 18 mois on payait 30$ pour la même chose chez OpenAI. Facteur 400. C'est pas une baisse, c'est une chute libre.
Ce que personne ne dit : à ces prix, le coût compute n'est plus une barrière à l'entrée pour quoi que ce soit. Le moat c'est quoi alors ? Trois trucs à mon avis :
. la distribution (qui a déjà des utilisateurs)
. la verticalisation (qui sait intégrer dans un workflow métier spécifique)
. la latence (qui sait servir en 50 ms en bordure de réseau)
Tout le reste va être du commodity. Donc si vous êtes en train de monter une startup dont le pitch c'est "wrapper sur une API LLM", vous avez 12 mois pour pivoter.
5
6 commentaires