呢篇研究論文題為 "The Case for Contextual Copyleft: Licensing Open Source Training Data and Generative AI"(情境式Copyleft嘅案例:為開源訓練數據與生成式AI授權),已經發表喺《牛津國際法與科技期刊》(Oxford Journal of International Law & Technology) 。
合理使用(Fair Use)門檻
CCAI有冇得執行,好大程度上取決於法庭點樣裁定「用受版權保護嘅程式碼去訓練AI模型」呢個行為,係咪構成版權法中嘅「合理使用」 。如果法庭最終判咗AI訓練係合理使用,咁即係話訓練本身就唔需要預先拎版權許可,授權條款嘅限制就會好難強制執行
。
衍生著作(Derivative Work)嘅分類
法律界目前仲未傾掂數:一個訓練好嘅AI模型,連埋佢啲權重(weights),到底可唔可以被歸類為訓練程式碼嘅「衍生著作」?呢個係CCAI法律基礎嘅核心問題,一日未定奪,一日都有變數 。
唔同司法管轄區嘅差異
版權規則同豁免條款喺唔同國家有好大分別。一個喺美國行得通嘅授權框架,喺歐盟、中國或者其他地方可能完全係另一回事,導致全球執行會非常混亂 。
實際執行嘅技術難度
就算法律上講得通,現實上要執行都好頭痕。而家啲大模型通常係用海量、混合咗好多來源嘅數據集訓練出嚟,要追溯返某一小段開源程式碼嘅「身世」,證明佢有冇被用過、用咗幾多,技術上極之困難 。
Comments
0 comments