What should I do next in practice?

Hukommelsesforbruget reduceres med ca. 72 % – Gemma 4 E2B modellen kan med en ny mobil optimering komme helt ned på 1 GB [5][12].

← Back to Trending

AnswersPublished4 days agoLast edited 2 days ago23 sources

Google åbner for avanceret AI på forbrugerhardware med nye Gemma 4 QAT-modeller

Google har offentliggjort officielle QAT checkpoints (Quantization Aware Training) til hele Gemma 4 familien, der omfatter E2B, E4B, 12B, 26B A4B og 31B [1][4][5]. QAT metoden simulerer kvantisering allerede under træning, så de 4 bit komprimerede modeller bevarer næsten samme kvalitet som de originale 16 bit versio...

Search & fact-check with Studio Global AI Browse more Trending pages

281K0

Google Gemma 4 QAT model compression unlocking mobile and consumer GPU deployment illustrated as a large neural network being compressed efficiently into a smartphone. — What are the key details of Google's June 4 release of Gemma 4 QAT models, including their quantization approach, supported model sizes andGoogle's QAT checkpoints compress Gemma 4 models by roughly 72%, enabling deployment on hardware from smartphones to consumer GPUs.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What are the key details of Google's June 4 release of Gemma 4 QAT models, including their quantization approach, supported model sizes and. Article summary: Google provides official Quantization-Aware Training (QAT) checkpoints for Gemma 4, and the Gemma 4 lineup includes E2B, E4B, 12B, 26B A4B, and 31B sizes [1][4][5]. Here are the key details.. Topic tags: general, documentation, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# What Is Google Gemma 4? Google Gemma 4 is the most capable open model family from DeepMind yet, shipping four sizes under Apache 2.0 with multimodal input, native reasoning, and" source context "What Is Google Gemma 4? Architecture, Benchmarks, and Why It ..." Reference image 2: visual subject "# What Is Google Gemma 4? Google
openai.com

Google har taget et bemærkelsesværdigt skridt for at gøre avancerede, åbne AI-modeller tilgængelige på helt almindeligt forbrugerudstyr. Den 5. juni 2025 offentliggjorde de officielle QAT-checkpoints (Quantization-Aware Training) til hele deres nye Gemma 4-serie . Det er en teknik, der gør det muligt at skære op mod 72 % af hukommelsesforbruget, uden at modellernes præcision forringes nævneværdigt .

Hvad er QAT, og hvorfor er det en gamechanger?

Kvantisering handler i bund og grund om at reducere præcisionen af de tal, en AI-model gemmer og regner med. Hvor en model normalt bruger 16-bit (BF16) til hver vægt, nøjes en 4-bit (int4) model med kun 4 bit – en firdobling af effektiviteten .

Traditionel efter-træningskvantisering (PTQ) komprimerer en færdigtrænet model, hvilket ofte koster på kvaliteten. QAT er smartere: Her simuleres kvantiseringen allerede under træningsprocessen, så modellen lærer at kompensere for det præcisionstab, der opstår . Google sammenligner det med, at modellen bliver "trænet med komprimeringen i tankerne", hvilket resulterer i en 4-bit udgave, der performer næsten identisk med originalen .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Model	Type	Hukommelse (4-bit)	Besparelse vs. 16-bit
E2B	2,3 mia. parametre (effektiv), tæt + PLE	~3,2 GB	~72 % lavere
E4B	4,5 mia. parametre (effektiv), tæt	~5 GB	~72 % lavere
12B	11,95 mia. parametre, tæt, encoder-fri	~7 GB	~72 % lavere
26B A4B	26 mia. totale (3,8 mia. aktive), Mixture-of-Experts	~15 GB	~72 % lavere
31B	30,7 mia. parametre, tæt	17-20 GB	~72 % lavere

Google åbner for avanceret AI på forbrugerhardware med nye Gemma 4 QAT-modeller

Hvad er QAT, og hvorfor er det en gamechanger?

Search, cite, and publish your own answer

People also ask

What is the short answer to "Google åbner for avanceret AI på forbrugerhardware med nye Gemma 4 QAT-modeller"?

What are the key points to validate first?

What should I do next in practice?

Sources

Comments

Gemma 4-serien: Fra mobilen til arbejdsstationen

Udgivelsesformater: Mere end bare én opskrift

Hvad kan du køre og på hvilket udstyr?