答案已發布2 週前Last edited 2 週前16 個來源

耶魯研究員力推 CCAI 授權：用開源碼練 AI，模型必須反哺社群

Q: 最值得優先驗證的重點是什麼？

耶魯大學的研究人員正在探索一個方案，以應對 AI 公司「白嫖」開源社群代碼的問題 [3]。 解決方案是一套名為「情境式 Copyleft AI 授權」（CCAI）的新框架 [4]。

耶魯大學的研究人員正在探索一個方案，以應對 AI 公司「白嫖」開源社群代碼的問題 [3]。解決方案是一套名為「情境式 Copyleft AI 授權」（CCAI）的新框架 [4]。核心概念是將傳統的 copyleft「傳染性」原則延伸至生成式 AI 領域。只要用了這類授權的代碼去訓練模型，該模型及其衍生版本都必須保持相同的開放性 [3]。

使用 Studio Global AI 搜尋並查證事實瀏覽更多熱門頁面

274K0

Conceptual illustration of the Contextual Copyleft AI License connecting open-source code to an AI model as a derivative work — What is the Contextual Copyleft AI License (CCAI) proposed by Yale researchers, what legal principle does it extend to AI models trained onYale researchers propose a license that treats AI models trained on open-source code as derivative works, requiring reciprocal transparency from developers.
AI 提示詞
Create a landscape editorial hero image for this Studio Global article: What is the Contextual Copyleft AI License (CCAI) proposed by Yale researchers, what legal principle does it extend to AI models trained on. Article summary: Here is a concise answer drawn from the Yale news article, the SSRN paper, and the arXiv preprint [3][5][4].. Topic tags: general, education, academic, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "Researchers at **Yale's Digital Ethics Center** published a study proposing a **Contextual Copyleft AI License (CCAI)** that would treat generative AI models trained on open-source" source context "Yale Researchers Propose Copyleft Rules for AI Models | Let's Data Science" Reference image 2: visual subject "Called the Contextual Copyleft AI License (CCAI), the proposal extends traditional open-source co
openai.com

什麼是「情境式 Copyleft AI 授權」（CCAI）？

這套**「情境式 Copyleft AI 授權」（CCAI）**是由耶魯大學數位倫理中心（DEC）的研究團隊提出的全新授權框架。它的核心思想，是將自由暨開放原始碼軟體（FOSS）社群奉行了數十年的 copyleft（著佐權） 精神，原封不動地搬到生成式 AI 的世界裡。

簡單來說，現行的開源授權（如 GPL 等）有一個很經典的「傳染」機制：你修改了別人的開源程式碼，那你衍生出來的軟體通常也必須用同樣的授權條款釋出，不能鎖起來自己賺。但問題來了，如果今天 AI 公司是把你的開源程式碼**拿去「訓練」**一個超大型模型，而不是直接複製貼上呢？這在法律上就進入灰色地帶了。

耶魯團隊的想法很直接：你既然用了標示為 CCAI 授權的代碼當作「養分」，那養出來的生成式 AI 模型本身就應該被視為該代碼的**「衍生作品」**，這就觸發了 copyleft 的義務。換言之，你想白拿社群的心血去打造封閉的收費產品？門都沒有。

這套授權會要求 AI 開發者做什麼？

一旦模型使用了 CCAI 授權的代碼進行訓練，AI 開發者就背負了強制性的透明義務，必須向公眾揭露以下幾項關鍵資訊：

模型架構：這個 AI 的設計理念與技術結構長什麼樣子。
訓練數據：餵給模型吃了哪些資料集。
連鎖授權：模型本身，以及之後任何人再基於這個模型去改出來的東西，通通都必須繼續沿用一樣的 CCAI 授權，不能改回閉源。

這個提案的目標非常明確，就是要防止 AI 巨頭只從開源社群「吸取養分」，卻不願「灌溉回饋」的單向剝削行為。

這篇論文的作者是誰？

這項研究發表在 《牛津國際法與科技期刊》（Oxford Journal of International Law & Technology） ，論文題目為**《The Case for Contextual Copyleft: Licensing Open Source Training Data and Generative AI》**（中譯：情境式著佐權案例：為開源訓練數據與生成式 AI 授權）。

背後的作者陣容堅強，全都與耶魯大學數位倫理中心有關：

Grant Shanklin：第一作者，耶魯學院 de Vries-Sherif 青年研究員。
Claudio Novelli：DEC 研究員。
Emmie Hine：DEC 研究員。
Luciano Floridi：John K. Castle 講座教授、DEC 創始主任。
Tyler Schroder：DEC 前大學部研究員。

理想很豐滿，但法律上的「不確定性」在哪？

這個架構聽起來很美好，但連研究團隊自己都坦承，CCAI 在現實世界的法庭上能不能站得住腳，還是一場硬仗。他們點出了幾個最棘手的未爆彈：

「合理使用」的天花板：這是最大的變數。CCAI 能不能強制執行，全看法院認定「拿有著作權的代碼去訓練 AI」這個行為到底算不算合理使用。在美國或其他普通法國家，如果法官最後拍板定案，說這本來就是合理使用、不需要另外取得著作權人許可，那 CCAI 的授權限制威力就會大減。
模型到底算不算「衍生作品」？：在法律上，一個訓練好、充滿「權重」的 AI 模型，到底算不算是那些訓練用程式碼的「衍生作品」？目前學界與實務界都沒有共識，這在國會圖書館的報告中也一再被提及。如果法律不這麼認定，那整棟 copyleft 大樓的地基就垮了。
各國管轄權大亂鬥：每個國家的著作權法規定、例外條款都不一樣。在 A 國可以執行的授權，到了 B 國的法院可能直接被宣告無效，跨國官司更是難上加難。
實務上的「舉證地獄」：現在的 AI 模型動不動就是從網路海量的混雜資料中訓練出來的。要如何在法庭上精準證明「我的那幾行 GPL 代碼真的有被收進去訓練」，並且「對模型的產出有直接影響」，在技術上就是一道極高的門檻。

總歸一句，CCAI 是一個學理上擲地有聲的前衛概念，但它能否從論文走進現實、成為開源社群的強力護盾，完全取決於未來著作權的幾個關鍵官司怎麼打。尤其是「生成式 AI 訓練是否為合理使用」以及「模型是否為衍生作品」這兩道終極大哉問。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查證事實

大家也會問