中國政法大學(xué)張濤在《比較法研究》2024年第4期上發(fā)表題為《生成式人工智能訓(xùn)練數(shù)據(jù)集的法律風(fēng)險與包容審慎規(guī)制》的文章中指出:
生成式人工智能是一種可以生成內(nèi)容(如文本、圖像、音頻、視頻等)的人工智能技術(shù),若要開發(fā)能夠執(zhí)行此種操作的應(yīng)用程序,就必須使用大量數(shù)據(jù)訓(xùn)練底層模型,使之能夠識別數(shù)據(jù)集中的模式和結(jié)構(gòu)。訓(xùn)練數(shù)據(jù)集是直接作為模型訓(xùn)練輸入的數(shù)據(jù),包括預(yù)訓(xùn)練、優(yōu)化訓(xùn)練過程中的輸入數(shù)據(jù);訓(xùn)練數(shù)據(jù)集的類型、規(guī)模和使用方式直接決定生成式人工智能模型的成敗。
從理論與實(shí)踐來看,生成式人工智能的訓(xùn)練數(shù)據(jù)集具有雙重法律地位:一是從功能定位的角度看,在人工智能時代,訓(xùn)練數(shù)據(jù)集已經(jīng)成為數(shù)字基礎(chǔ)設(shè)施的重要組成部分;二是從法律屬性的角度看,訓(xùn)練數(shù)據(jù)集是一種聚合型權(quán)益客體,涉及多個主體的多種權(quán)益。
為了檢視訓(xùn)練數(shù)據(jù)集可能存在的法律風(fēng)險,有必要采取一種多維或多部門法融合交叉的視角,根據(jù)不同的法律規(guī)則進(jìn)行風(fēng)險識別與評估。從理論與實(shí)踐來看,生成式人工智能訓(xùn)練數(shù)據(jù)集的突出法律風(fēng)險主要包括著作權(quán)法風(fēng)險(即未經(jīng)許可使用作品)和個人信息保護(hù)法風(fēng)險(即違法處理個人信息)。然而,現(xiàn)有規(guī)制框架卻呈現(xiàn)風(fēng)險防范形式化的現(xiàn)象,許可使用、合理使用等著作權(quán)法律規(guī)則難以因應(yīng)規(guī)模化的訓(xùn)練數(shù)據(jù)集,而個人同意、目的限制與數(shù)據(jù)最小化等個人信息保護(hù)機(jī)制及原則亦存在效能不彰的問題。為此,有必要重構(gòu)生成式人工智能訓(xùn)練數(shù)據(jù)集的規(guī)制框架,首先需要明確訓(xùn)練數(shù)據(jù)集的規(guī)制目標(biāo),應(yīng)當(dāng)從以權(quán)利保護(hù)為中心進(jìn)階為以公平使用為目的,即從單純地保護(hù)相關(guān)主體的權(quán)利和利益,進(jìn)階為促進(jìn)訓(xùn)練數(shù)據(jù)集的公平、合理、有效使用,以實(shí)現(xiàn)生成式人工智能的社會價值和公共利益的最大化。其次需要明確訓(xùn)練數(shù)據(jù)集的規(guī)制路徑,應(yīng)當(dāng)從命令控制型規(guī)制轉(zhuǎn)向包容審慎規(guī)制,即從單純地依靠法律和行政的強(qiáng)制性規(guī)制,到兼顧法律、倫理、技術(shù)標(biāo)準(zhǔn)等多元規(guī)范以及政府、企業(yè)、社會組織等多元主體的協(xié)同性規(guī)制,以適應(yīng)生成式人工智能的技術(shù)特性和規(guī)制需求。
為了實(shí)現(xiàn)生成式人工智能訓(xùn)練數(shù)據(jù)集的包容審慎規(guī)制,一是要構(gòu)建包容審慎的著作權(quán)法規(guī)制,包括重構(gòu)合理使用的標(biāo)準(zhǔn)與范圍、構(gòu)建著作權(quán)臨時許可裁定制度、發(fā)布著作權(quán)合規(guī)最佳實(shí)踐指南;二是要邁向包容審慎的個人信息保護(hù)法規(guī)制,包括拓展個人信息處理的合法性基礎(chǔ)、改造告知同意機(jī)制、實(shí)施個人信息保護(hù)影響評估。
編輯:武卓立