耶魯大學的研究人員正在探索一個方案,以應對 AI 公司「白嫖」開源社群代碼的問題 [3]。 解決方案是一套名為「情境式 Copyleft AI 授權」(CCAI)的新框架 [4]。 核心概念是將傳統的 copyleft「傳染性」原則延伸至生成式 AI 領域。只要用了這類授權的代碼去訓練模型,該模型及其衍生版本都必須保持相同的開放性 [3]。

Create a landscape editorial hero image for this Studio Global article: What is the Contextual Copyleft AI License (CCAI) proposed by Yale researchers, what legal principle does it extend to AI models trained on. Article summary: Here is a concise answer drawn from the Yale news article, the SSRN paper, and the arXiv preprint [3][5][4].. Topic tags: general, education, academic, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "Researchers at **Yale's Digital Ethics Center** published a study proposing a **Contextual Copyleft AI License (CCAI)** that would treat generative AI models trained on open-source" source context "Yale Researchers Propose Copyleft Rules for AI Models | Let's Data Science" Reference image 2: visual subject "Called the Contextual Copyleft AI License (CCAI), the proposal extends traditional open-source co
這套**「情境式 Copyleft AI 授權」(CCAI)**是由耶魯大學數位倫理中心(DEC)的研究團隊提出的全新授權框架 。它的核心思想,是將自由暨開放原始碼軟體(FOSS)社群奉行了數十年的 copyleft(著佐權) 精神,原封不動地搬到生成式 AI 的世界裡
。
簡單來說,現行的開源授權(如 GPL 等)有一個很經典的「傳染」機制:你修改了別人的開源程式碼,那你衍生出來的軟體通常也必須用同樣的授權條款釋出,不能鎖起來自己賺。但問題來了,如果今天 AI 公司是把你的開源程式碼**拿去「訓練」**一個超大型模型,而不是直接複製貼上呢?這在法律上就進入灰色地帶了。
耶魯團隊的想法很直接:你既然用了標示為 CCAI 授權的代碼當作「養分」,那養出來的生成式 AI 模型本身就應該被視為該代碼的**「衍生作品」**,這就觸發了 copyleft 的義務 。換言之,你想白拿社群的心血去打造封閉的收費產品?門都沒有。
一旦模型使用了 CCAI 授權的代碼進行訓練,AI 開發者就背負了強制性的透明義務,必須向公眾揭露以下幾項關鍵資訊 :
這個提案的目標非常明確,就是要防止 AI 巨頭只從開源社群「吸取養分」,卻不願「灌溉回饋」的單向剝削行為 。
這項研究發表在 《牛津國際法與科技期刊》(Oxford Journal of International Law & Technology) ,論文題目為**《The Case for Contextual Copyleft: Licensing Open Source Training Data and Generative AI》**(中譯:情境式著佐權案例:為開源訓練數據與生成式 AI 授權) 。
這個架構聽起來很美好,但連研究團隊自己都坦承,CCAI 在現實世界的法庭上能不能站得住腳,還是一場硬仗。他們點出了幾個最棘手的未爆彈 :
「合理使用」的天花板:這是最大的變數。CCAI 能不能強制執行,全看法院認定「拿有著作權的代碼去訓練 AI」這個行為到底算不算合理使用。在美國或其他普通法國家,如果法官最後拍板定案,說這本來就是合理使用、不需要另外取得著作權人許可,那 CCAI 的授權限制威力就會大減 。
模型到底算不算「衍生作品」?:在法律上,一個訓練好、充滿「權重」的 AI 模型,到底算不算是那些訓練用程式碼的「衍生作品」?目前學界與實務界都沒有共識,這在國會圖書館的報告中也一再被提及 。如果法律不這麼認定,那整棟 copyleft 大樓的地基就垮了。
各國管轄權大亂鬥:每個國家的著作權法規定、例外條款都不一樣。在 A 國可以執行的授權,到了 B 國的法院可能直接被宣告無效,跨國官司更是難上加難 。
實務上的「舉證地獄」:現在的 AI 模型動不動就是從網路海量的混雜資料中訓練出來的。要如何在法庭上精準證明「我的那幾行 GPL 代碼真的有被收進去訓練」,並且「對模型的產出有直接影響」,在技術上就是一道極高的門檻 。
總歸一句,CCAI 是一個學理上擲地有聲的前衛概念,但它能否從論文走進現實、成為開源社群的強力護盾,完全取決於未來著作權的幾個關鍵官司怎麼打。尤其是「生成式 AI 訓練是否為合理使用」以及「模型是否為衍生作品」這兩道終極大哉問 。
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
耶魯大學的研究人員正在探索一個方案,以應對 AI 公司「白嫖」開源社群代碼的問題 [3]。
耶魯大學的研究人員正在探索一個方案,以應對 AI 公司「白嫖」開源社群代碼的問題 [3]。 解決方案是一套名為「情境式 Copyleft AI 授權」(CCAI)的新框架 [4]。
核心概念是將傳統的 copyleft「傳染性」原則延伸至生成式 AI 領域。只要用了這類授權的代碼去訓練模型,該模型及其衍生版本都必須保持相同的開放性 [3]。
Loading comments...
Comments
0 comments