Pourquoi les modèles de raisonnement explosent-ils les coûts de calcul en production ?
Les modèles de raisonnement en IA, bien que performants, font exploser les coûts de calcul en production en consommant jusqu'à 10 fois plus de tokens. Une analyse publiée aujourd'hui explique pourquoi cette tendance, appelée *Inference Scaling*, représente un défi majeur pour les entreprises.