JawabanDipublikasikan2 bulan yang laluLast edited bulan lalu15 sumber

Model Collapse pada AI: Risiko Saat Model Dilatih dengan Data Buatan AI

Penelitian menunjukkan bahwa melatih model AI berulang kali dengan data sintetis dapat menyebabkan “model collapse”, yaitu hilangnya pola langka sehingga model semakin menyimpang dari distribusi data asli. Pelatihan rekursif memperbesar bias sampling: peristiwa langka di ekor distribusi semakin jarang muncul, hingga...

Cari dan periksa fakta dengan Studio Global AI Jelajahi lebih banyak halaman Trending

Concept illustration of AI model collapse showing synthetic data loops shrinking a distribution and removing rare patterns — What does the new study on AI model collapse find about preventing degradation when models are trained on synthetic data, why does recursiveRecursive training on AI‑generated data can gradually erase rare patterns from a model’s learned distribution, a phenomenon researchers call model collapse.
AI Perintah
Create a landscape editorial hero image for this Studio Global article: What does the new study on AI model collapse find about preventing degradation when models are trained on synthetic data, why does recursive. Article summary: The study describes model collapse as a failure mode where recursively trained generative models lose information about the original data distribution, especially its rare or low-probability regions.. Topic tags: general, government, education, academic, general web. Reference image context from search candidates: Reference image 1: visual subject "However, as AI-generated data increasingly populates the internet, an important question arises: What happens when new AI models are trained on datasets containing their previous o" source context "Avoiding Model Collapse in AI Training - Risk Insight" Reference image 2: visual subject "Artificial intelligence models
openai.com

Generative AI semakin sering dilatih menggunakan data sintetis—konten yang dihasilkan oleh model AI sebelumnya. Pendekatan ini memang membantu memperbesar dataset, tetapi penelitian terbaru memperingatkan adanya risiko serius yang disebut model collapse. Fenomena ini terjadi ketika model perlahan kehilangan kemampuan untuk merepresentasikan keragaman data asli.

Dalam studi tentang pelatihan rekursif, peneliti menemukan bahwa ketika model terus belajar dari keluaran AI sebelumnya—bukan dari data dunia nyata—model mulai "melupakan" pola yang jarang muncul dalam distribusi data. Seiring generasi pelatihan berikutnya, pola yang hilang ini menumpuk hingga representasi realitas oleh model menjadi semakin menyempit dan terdistorsi.

Masalah ini menjadi semakin penting karena konten buatan AI kini makin banyak beredar di internet, yang berarti dataset masa depan berisiko dipenuhi oleh data sintetis.

Apa Itu “Model Collapse”?

Model collapse adalah kegagalan dalam sistem generatif ketika model dilatih menggunakan data yang dihasilkan model lain, bukan data asli yang dibuat manusia.

Peneliti menemukan bahwa pelatihan semacam ini dapat menyebabkan cacat yang tidak dapat dipulihkan pada model. Secara bertahap, model kehilangan informasi tentang bagian “ekor” dari distribusi data—yakni contoh yang jarang muncul tetapi penting untuk menggambarkan dunia secara akurat.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Cari dan periksa fakta dengan Studio Global AI

Orang-orang juga bertanya

Apa jawaban singkat untuk "Model Collapse pada AI: Risiko Saat Model Dilatih dengan Data Buatan AI"?

Apa poin penting yang harus divalidasi terlebih dahulu?

Apa yang harus saya lakukan selanjutnya dalam latihan?

Analisis terbaru menunjukkan bahkan sedikit data dunia nyata atau pengetahuan awal (prior) dapat mencegah collapse dengan menjaga bukti bahwa pola langka tersebut memang ada.

Model Collapse pada AI: Risiko Saat Model Dilatih dengan Data Buatan AI

Apa Itu “Model Collapse”?

Search, cite, and publish your own answer

Orang-orang juga bertanya

Apa jawaban singkat untuk "Model Collapse pada AI: Risiko Saat Model Dilatih dengan Data Buatan AI"?

Apa poin penting yang harus divalidasi terlebih dahulu?

Apa yang harus saya lakukan selanjutnya dalam latihan?

Sumber

Mengapa Pelatihan Rekursif Menghapus Pola Langka

Bagaimana Data Nyata atau Pengetahuan Awal Mencegah Collapse

Mengapa Ini Penting untuk Large Language Models

Batasan Bukti yang Ada