RéponsesPubliéil y a 5 joursLast edited il y a 5 jours29 sources

L'IA locale gère déjà 88,7% des requêtes : l'étude de Stanford qui bouscule les géants du cloud

Les petits modèles de langage locaux (≤20 milliards de paramètres) exécutés sur des PC portables répondent correctement à 88,7% des requêtes, selon une prépublication de Stanford de novembre 2025. La part des requêtes que les modèles locaux peuvent traiter est passée de 23,2% en 2023 à 71,3% en 2025, soit un bond de...

Rechercher et vérifier les faits avec Studio Global AI Voir plus de pages tendance

49K0

AI-generated editorial image representing local AI models running on a laptop, with a glowing brain icon, benchmark charts, and a visual of the 'Intelligence Per Watt' metric. — What did the Stanford University study published as a preprint in November 2025 find about the performance, accuracy, "intelligence per wattConceptual illustration of the Stanford 'Intelligence Per Watt' study, showing local AI inference on a laptop outperforming cloud data-center models in efficiency for most tasks.
Prompt IA
Create a landscape editorial hero image for this Studio Global article: What did the Stanford University study published as a preprint in November 2025 find about the performance, accuracy, "intelligence per watt. Article summary: ## Key Findings from the Stanford "Intelligence Per Watt" Study (November 2025 Preprint). Topic tags: general, academic, education, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative visual,
openai.com

L'économie de l'intelligence artificielle pourrait être sur le point de connaître un bouleversement majeur. Une étude approfondie de l'Université de Stanford, publiée en prépublication (preprint) en novembre 2025, établit que les petits modèles de langage exécutés sur du matériel grand public (ordinateurs portables et de bureau) peuvent désormais traiter la grande majorité des tâches qui nécessitaient auparavant des systèmes d'IA cloud coûteux .

Les travaux, menés par Jon Saad-Falcon, Avanika Narayan et leurs collègues du groupe Hazy Research de Stanford et de Together AI, introduisent une nouvelle métrique appelée Intelligence par Watt (IPW) — définie comme la précision moyenne des tâches divisée par la puissance moyenne consommée lors de l'inférence — afin de fournir un moyen unifié de comparer les systèmes d'IA locaux et cloud .

Ce que révèle l'étude de Stanford : les chiffres clés

Les travaux empiriques de l'étude sont considérables : ils comparent plus de 20 modèles de langage locaux sur 8 accélérateurs différents (dont ceux d'Apple, AMD et NVIDIA) en utilisant 1 million de requêtes réelles de chat et de raisonnement à un seul tour . Les résultats principaux sont frappants :

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Rechercher et vérifier les faits avec Studio Global AI

Les gens demandent aussi

Câu trả lời ngắn gọn cho "L'IA locale gère déjà 88,7% des requêtes : l'étude de Stanford qui bouscule les géants du cloud" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Un système de routage intelligent, qui attribue chaque requête au modèle le plus petit capable de la traiter, pourrait réduire les coûts d'inférence cloud de 60,2% tout en maintenant la précision.

Sources

Comments

0 comments

Loading comments...

L'IA locale gère déjà 88,7% des requêtes : l'étude de Stanford qui bouscule les géants du cloud

Ce que révèle l'étude de Stanford : les chiffres clés

Search, cite, and publish your own answer

Les gens demandent aussi

Câu trả lời ngắn gọn cho "L'IA locale gère déjà 88,7% des requêtes : l'étude de Stanford qui bouscule les géants du cloud" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Sources

Comments

La métrique 'Intelligence par Watt' expliquée

Routage hybride : une réduction des coûts de 60%

Ce que cela signifie pour OpenAI, Anthropic et xAI

La tendance générale : l'IA devient moins chère, plus vite

Une réserve : l'étude a des limites

En résumé