The Thermodynamic
Efficiency Inversion
De la requête à la tâche : bilan énergétique comparatif de l'inférence LLM face au web publicitaire mobile A Comparative Energy Lifecycle Assessment of Generative AI Inference versus Ad-Supported Web Search Sessions
En déplaçant l'unité fonctionnelle de la requête serveur à la session utilisateur complète, cette évaluation montre comment l'IA générative contourne la taxe énergétique massive du web publicitaire. Résultat central : pour les tâches de synthèse complexes sur mobile, une session LLM consomme 4 à 9× moins d'énergie qu'une session de recherche web équivalente, avec une estimation centrale de 5,4× et un plancher de 1,6× sur 10 000 tirages Monte Carlo. By shifting the functional unit from server queries to full user sessions, this assessment demonstrates how generative AI bypasses the massive energy tax of the modern ad-supported web. Central finding: for complex synthesis tasks on mobile, an LLM session consumes 4–9× less energy than an equivalent ad-supported web search session, with a central estimate of 5.4× and a worst-case floor of 1.6× across 10,000 Monte Carlo draws.
4–9× Moins d'énergie totale
LLM vs. web publicitaire Less total energy
LLM vs. ad-supported web Tâches complexes · mobile Complex tasks · mobile
5.4× Estimation centrale
de l'avantage Central estimate
efficiency advantage Session mobile de 3 pages 3-page mobile session
1.6× Plancher (pire cas)
LLM standard Lower bound
standard LLM 9 paramètres · 10k tirages 9 free parameters · 10k draws