引言
技術變革使得數據成為一類新的生產要素,在數據獲取、利用、交易實踐中產生了一系列糾紛,而產生法律界權保護之必要。然而,傳統民法或知識產權法體系都難以對大數據集合進行恰當定位和保護。司法實踐主要通過《反不正當競爭法》一般條款調整大數據糾紛,卻存在法律適用標準模糊、不可預見、合理利用例外不明確等缺陷。我國正積極探索建立專門的大數據保護制度,在大數據保護制度路徑選擇中,理論上有不同觀點:有學者主張采財產權保護模式,在數據客體之上設立新型“數據財產權”,為企業數據投資提供全面保護;有學者則擔憂設立新型“數據財產權”會阻礙數據共享和自由流動,主張采用行為法保護模式,通過完善反不正當競爭法對大數據提供保護。數據保護立法完善需要在不同制度路徑之間作出衡量和選擇,是否設立新的數據財產權,很大程度上取決于財產權制度本身的可行性或可操作性。盡管多數觀點傾向于在數據之上設立“數據財產權”,但現階段大多數研究停留在概念厘清、正當性分析、制度框架勾勒的宏觀層面,尚未就“數據財產權”的具體制度設計進行深入探討而達成相對一致共識。因此,立法難以等待數據保護路徑問題被解決之后,再來探討具體設計問題。欲明確數據保護立法路徑,必先探索明確“數據財產權”的制度可能,與行為法保護模式之間就其優劣問題進行綜合對比。
事實上,就“數據財產權”構造,既有制度實踐中存在直接的經驗參照。在大數據出現之前,歐盟1996年《數據庫保護指令》(以下簡稱《指令》)創設的數據庫特別權利(Sui Generis Right)制度確立了為數據提供財產權保護的最早實踐。大數據與數據庫本質上都是數據集合,二者保護面臨的問題具有相似性。構建“數據財產權”制度,相對務實的方式是在既有制度經驗中尋求借鑒并進行漸進式改良。因此,為回應數據保護路徑爭議,本文擬按照提出假設——檢驗假設——改進假設的邏輯進行探討,即假設未來立法者采取財產權保護模式,以最接近的既有制度經驗——歐盟數據庫特別權利制度為基礎建構“數據財產權”的基本模型,進而檢驗財產權模式能否解決實踐問題挑戰,為數據保護路徑選擇以及保護范圍厘定提供制度建議。
一、“數據財產權”設權應然邏輯與現實路徑
構建大數據保護制度,前提是厘清大數據保護的正當性基礎和待解決的基本問題。當前,主流觀點之一主張在大數據集合之上設置新型財產權利,正當性基礎主要是將數據類比于有體財產,基于勞動財產理論主張在數據之上設立新的財產權。如有學者認為:“數據企業通過大量收集個人信息以及非個人信息形成了新的數據集,而無數個人信息匯集成的數據集就成為了一個新的客體并在其上產生了數據企業的民事權利。這種法律效果與民事主體合法建造房屋而自該房屋建造完畢之時取得房屋的所有權是相同的。換言之,數據企業只要是合法地收集并存儲數據,就可以基于這種行為取得對數據的權利。”在權利構造上,數據財產權接近于物權設計,具有絕對性和排他性,是權利人直接支配特定的數據財產并排除他人干涉的權利,其權能包括數據財產權人對自己的數據財產享有的占有、使用、收益、處分的權利。
將勞動財產理論以及傳統物權模型直接適用于信息財產賦權存在明顯局限性。因為在洛克式的勞動財產理論下,有體物必須撥歸私有才能充分利用,故而存在私有財產賦權之必要,并且有體物可以通過占有、添附等形式使財產脫離公有狀態而向社會公示,某一民事主體對此有體財產的排他性占有、使用很少會對第三人或公共利益產生影響。然而,信息非競爭性、非排他性、非易耗性的公共物品特質決定了它在私有財產賦權必要性、權利取得要件以及排他性權能設置方面與傳統有體物存在顯著不同:第一,區別于有體物必須撥歸私有才能最大化利用,非競爭性、非排他性的信息可以被無數人同時占有、利用,已生產而處于公有領域的信息不具有稀缺性而并無設置私有財產權的必要,不加限制地允許所有人共同占有、使用反而可以實現社會福利最大化;但是未生產信息具有稀缺性,需要私有產權保護以激勵信息創造的人力和資本投入。故區別于有體財產以勞動作為財產賦權的正當性基礎,信息產權賦權和權能設置應以激勵未知信息創造為必要。第二,在信息生產過程中,民事主體雖然可以在公有領域信息的基礎上,運用個人勞動進行進一步加工,但并非只要通過勞動即可取得對信息的排他性權利。因為智力成果創造并非是完全“無中生有”,作品創作以及技術發明都是既有知識之上的累積性創新,個人在公有領域之上的添附或創造,在何種程度上脫離公有領域成為“新的財產”面臨著現實上的判斷困難,必須從一定政策目標出發設定權利取得閾值并加以人為判斷。第三,與傳統有體財產不同,信息具有公共物品所具有的非競爭、非排他的特性,在其上設置排他性權利必將阻塞權利人之外的社會公眾獲取該信息的渠道,這對社會影響的范圍遠超過在有體物上創設物權的本旨,由于信息本身具有較強的公共屬性,如果無法完成個人創造與公有領域的清晰界分,或者不加限制地授予他人在信息之上的排他權利,將會導致個人對于公有領域的不當壟斷和侵占。
有體財產與無體財產的特性不同,決定了數據在內的信息財產賦權難以直接套用勞動財產理論和傳統物權模式,在知識產權等信息財產授權中,相對普遍接受的是功利主義方法,即財產制度的設計需要在信息創造與公眾獲取信息之間達成精確利益平衡,從而實現社會整體福利的最大化。從經濟學的角度出發,已生產的公有領域的信息不具有稀缺性,故無論是否付出勞動都不需要賦予財產權,開放利用才能實現社會福利的最大化;未處于公有領域的信息是稀缺的,因為信息的生產過程具有特殊性,信息成果往往具有生產的高成本、復制的低成本、沒有特定對手的占有特征,如果法律不加介入會導致信息利用的搭便車行為和外部性問題,進而造成信息生產的市場失靈,故而有必要構建信息成果的產權保護機制,恢復市場競爭過程進而實現資源的最優配置。因此,信息之上設置財產制度的正當性基礎或總目標是要實現信息生產、利用效率的最大化,具體需要服務于三個子目標:第一,確保新的足夠數量的信息能夠被創造出來;第二,信息充分流動服務于生產;第三,將信息生產所需的社會成本降低至最低限度。這一功能定位決定了數據在內的信息財產授權的基本規律:以信息共有為一般原則,信息財產賦權必要立足信息生產的市場實踐并經歷嚴格的市場失靈論證考驗;為了實現激勵創造之目標,其權利授予應以一定創新性為授權閾值;為保障公共利益和公有領域,其權利保護應以特定期限、限制、例外為約束。既有信息財產保護模式——著作權、專利權、商標權等均非依循單一哲學邏輯而建構成為一種絕對的財產權利,而是在近百年的制度演進之中,隨著技術進步、商業模式變遷,不斷自我調整其權能、期限、例外等制度設計以維持新的系統平衡,雖然導致了知識產權制度體系的“雜亂無章”,卻是以實踐理性在創造者與公共利益之間平衡的最優結果。
從功利主義視角出發,當前大數據保護問題已基本滿足信息財產賦權的一般前提或正當性基礎:技術進步使得數據成為市場上生產、利用、流轉的新一類“財貨”,由于數據具有一般信息的公共物品特性,在立法缺乏充分保護的前提下,存在數據生產、交易市場失靈的風險:一方面,大數據具有體量龐大、類型多樣、快速變化、低價值密度的特點,導致大數據經濟體現出一定的規模經濟、范圍經濟的特點,即必須達到一定的數據量規模和范圍才能獲得實質性的競爭力,從而產生較高的沉沒成本;另一方面,數據具有一般信息的非競爭、非排他和非易耗的特征,對數據進行復制的邊際成本很低。如果法律上缺乏對于大數據集合的恰當定位和保護,競爭對手可以輕松獲取和復制數據,導致兩方面結果:第一,對必須公開才能利用的數據,將抑制企業在該領域的投資積極性甚至出現市場失靈;第二,對企業可以借助隱匿技術加以利用的數據,企業可能為了避免數據落入公有領域,將對數據嚴密保護并避免交易而抑制數據的流動和再利用。因此,有必要以法律之力保障企業投資數據之“產權”,從而恢復市場的資源配置功能。然而,市場失靈并不當然地證成構建“數據財產權”,還必須存在新型財產權模式建構的可行性。換言之,是否建立數據財產權制度,關鍵在于該制度是否具有可操作性,即能否在數據收集者與社會公眾之間劃定明晰邊界,實現保護數據投資與公眾獲取數據之間的恰當利益平衡。
因此,在“數據財產權”制度建構探索中,不在于精致完美的理性設計,而在于作出平衡各方利益的現實構造,相對務實的方式是立足最接近立法經驗進行制度構建。雖然大數據是新世紀之后的產物,但數據這一客體形式卻早已出現并被納入既有知識產權制度調整框架。20世紀80年代,信息技術發展使得人類第一次大規模地以電子數據存儲和處理信息,推動了數據庫產業的產生和繁榮,回顧歷史,數據庫保護的立法挑戰與當今大數據問題具有高度相似性:計算機技術使得大量的信息能夠以數字格式創建或轉化為數字格式存儲,提升了信息的存儲能力并降低存儲成本,與數據存儲技術進步相伴而生的是數據獲取和使用能力的提升,通過計算機程序可以快速地查找、分析數據,互聯網的出現也實現了在線使用數據庫,從而提升了數據庫的訪問便利和市場化能力。在信息時代,數據庫作為信息生產和創造的原材料具有了獨特的市場價值,技術進步擴大了數據庫影響和作用的同時也使得復制數據庫迅速而便利,對開發者市場化利用數據庫和投資回收形成了實質威脅。為了激勵投資以繁榮數據庫產業,歐盟(時為“歐洲經濟共同體”,簡稱“歐共體”)制定了《指令》,最早在全球范圍內確立了對非創造性數據庫內容的財產權保護,即數據庫制造者在收集、訂正和展示數據方面付出了實質性投資的,數據庫內容將受特別權利保護。進入數字經濟時代,面對大數據保護需求,特別權利也成為了保護大數據的主要制度選項之一,歐盟委員會關于《指令》評估的第二次專家報告指出,“特別權利可能比預想地要更廣泛地適用于大數據”,德國學者Matthias Leistner認為,特別權利在數字經濟下具有無可否認的適用潛力,絕大多數情況下大數據都可以為特別權利所涵蓋。可以說,歐盟數據庫特別權利保護制度是與大數據最為關系密切的知識產權制度模式,其制度運行為我國數據保護實踐提供了最為直接的經驗參照。
二、“數據財產權”理論構造
數據庫財產權模型可為建立“數據財產權”提供直接的經驗參照。然而,由數據庫到大數據在技術層面和商業應用層面都發生了實質性變化,基于特別權利制度探索構建“數據財產權”制度,需要將特別權利制度置于大數據商業實踐之下,檢驗其適用可行性并作出相應改進。具體而言,在大數據生成、利用、流轉的商業實踐中,涉及數據生成主體、收集主體、獲取主體和再利用主體四方面,大數據保護法律秩序構建則要實現不同方面的利益平衡:1.促進數據投資和創新;2.建立良好運作的競爭性市場和維護公共利益;3.保護消費者利益、用戶個人信息。2021年《個人信息保護法》的頒布可以確保用戶個人在與在數據收集者、處理者的互動中人格利益不受不法侵害,但仍有兩方面任務需要數據財產保護制度完成,即促進數據投資創新和保障市場競爭。構建一項新的“數據財產權”,需要回答保護客體、保護條件、保護權能、保護期限、限制例外等一系列問題,結合制度目標,主要有三方面任務:第一,基于財產權設置的正當性基礎,恰當地界定客體要件;第二,確定財產權保護權能,以充分實現創新激勵的制度目標;第三,基于促進市場競爭、保障公共利益的利益平衡考量,對財產權權能作出必要限制。
(一)“數據財產權”客體要件
客體要件是財產權制度構建的基礎,在數據庫財產權保護中,特別權利制度從兩方面界定客體要件:第一,界定保護客體,即數據集合構成“數據庫”;第二,界定保護條件,要求權利人在數據庫制作中付出了實質性投資。符合此兩項條件,方能賦予數據制作者排除他人提取、再利用數據庫實質性部分或全部的權利。現結合“數據庫”和“實質性投資”兩個要件,就“數據財產權”的客體要件探討如下:
1.保護客體。歐盟《指令》將調整對象界定為“數據庫”,第1條規定,數據庫包括以下要件,獨立作品、數據或素材的集合,經過系統或有序編排,并可以通過電子或其他方法獨立訪問。數據庫必須是獨立作品、數據或者其他材料的集合。根據歐盟法院解釋,由于數據庫保護的制度邏輯與傳統知識產權不同,為避免數據庫保護客體擴大到版權保護客體的范疇而對既有知識產權制度產生沖擊,故而作出此要求將數據庫與版權法上的作品相區分,如一部電影雖然由不同材料集合組成,總體來看它屬于一個整體故不屬于數據庫所調整的范疇,除此之外,如果構成數據庫的素材之間可以相互分離而不影響其價值則可滿足該要件。此外,從數據庫的技術特點出發,其要求獨立素材的集合要經過系統、有序的編排并可進行單獨訪問,但該要件門檻設置相對較低,也并不要求獨立素材在物理上以系統、有序的方式進行存儲,而只要可以通過技術手段例如電子、電磁或者其他手段(例如索引、目錄或者特定分類方法)對獨立材料進行檢索即可。
構建“數據財產權”應明確調整的基本對象,即如何在法律意義上界定所要調整的“大數據”。從技術層面來看,由“數據庫”到“大數據”發生了實質性的變化,大數據與數據庫的都以“數據”為基礎元素,即在計算機及信息網絡流通以0和1二進制符號組合表現出來的比特形式,二者根本上都是“數據”的集合。不同之處在于,傳統數據庫依據事先預定好的關系模型收集、存儲相關數據,從而實現對于有價值數據的管理、分析,但對大體量、低價值密度、需要實時分析應用的數據則無法事先分類處理存入數據庫中再來分析。傳統數據庫面臨的挑戰正是大數據技術發展的起點,在新一代技術架構下,人類可以通過高速收集、檢索和分析數據,進而在短時間內大體量、多樣性的數據之中獲取有價值信息,其來源不僅包括已經結構化處理的數據庫,更主要的是數字環境下用戶瀏覽痕跡、設備信息、分享資料等半結構化、非結構化數據,其客體范圍經歷了實質性擴張,傳統數據庫主要包含經過智力創造或加工的數據信息,大數據集合則突破此限制將大量事實性數據作為其直接來源。如果從法律層面界定需要保護的大數據,首先,與數據庫相同,“數據財產權”保護的客體應當是獨立數據、作品或素材的集合,從避免與傳統知識產權保護客體相重疊的角度,有必要繼續保留此要件。其次,“數據庫”要求數據經過系統或有序編排,并可以通過電子或其他方法獨立訪問,雖然目前的大數據集合基本都可以通過數據分析軟件實現對數據的獨立檢索而符合該要件,但該特征已并非大數據集合的必備或者典型特征,恰恰大部分都是半結構化、非結構化數據,故而不必遵循該要件。因此,應當相對寬泛地將保護客體定位為數據集合,即一切獨立電子數據、作品或素材的集合,從而將多數實踐情形納入調整范圍。
2.保護條件。傳統知識產權制度從鼓勵創造出發,僅對具有獨創性的作品或者具有新穎性、創造性的技術方案提供排他保護,數據內容往往具有事實性而無法納入傳統知識產權制度保護的范疇。然而,除了新的知識創造,事實性信息收集和累積也具有一定社會價值,構成社會生產生活的必要條件,故需要法律保護此類投資以鼓勵這種事實性信息的生產。因此,數據庫特別權利制度一改知識產權制度保護創造的傳統,而將保護投資作為制度目的,數據庫制造者在收集、訂正、展示其數據內容方面付出了實質性投資的,才可獲得特別權利保護。
從避免市場失靈出發,雖然保護數據投資具有充分的正當性,但并非所有數據的投資都值得保護,因為非獨創性數據具有較強的公共屬性,如果廣泛地依據他人投資而在數據之上設置一種壟斷性的權利,可能會置自由競爭和信息獲取自由于危險之地。因此,需要嚴格界定投資所需達到的條件,主要包括受投資保護的類型和投資所需達到的程度兩方面。
(1)受保護投資的類型。在數據庫特別權利保護中,根據《指令》第7條第1款規定,制造者在收集、訂正、展示其數據內容方面付出了實質性投資的,才獲得特別權利保護。與此相區別的是,數據創造的投資不受特別權利保護。主要原因在于,數據內容的創造者掌握了數據的單一來源,對數據創造投資的保護將導致創造者對于該單一來源數據的壟斷。2004年歐盟法院在BHB等四起案件中對此作了專門解釋,歐盟法院認為,《指令》第7條第1款規定的收集內容的投資必須理解為在制造數據庫的過程中獲取、搜集獨立材料的投資,驗證內容的投資指的是在數據創造或運行過程中為了保證數據庫信息內容準確性、可靠性進行的投資。該案中,當事人組織比賽生成馬匹列表等投資屬于創造數據的投資,創造數據并不屬于收集和驗證數據的投資。數據“創造”與“收集”的區分主要是為了平衡投資保護與信息傳播之間的關系,避免通過數據庫保護對“單一來源數據”的壟斷。然而,該區分卻在很大程度上限制了特別權利保護的適用范圍,因為特別權利保護制度旨在保護數據庫制作的投資,事實上數據庫內容制作的投資要遠超過數據庫制作本身的投資,故有學者認為,BHB等四個判決在事實上“肢解”了《指令》所規定的特別權利,使特別權利的存在失去了意義。
相對于傳統數據庫,大數據集合中存在大量的用戶行為、設備生成的原始數據及基于此產生的衍生數據,與傳統數據庫數據收集、訂正、展示投資不同,大數據集合往往并不涉及數據的訂正和展示,主要是制造智能設備、建設用戶網絡從而收集數據以及進一步加工數據的投資,如果按照數據創造與數據收集的區分,大部分數據投資將無法獲得保護。具體而言,依生成方式不同,大數據可分為貢獻數據(Volunteered Data),指的是用戶個人自行在網絡上分享的網絡資料,如姓名、生日、照片等;觀測數據(Observed Data),從用戶或機器的活動中自動獲得的行為數據,如用戶訪問網站內容記錄、設備運行狀況等;衍生數據(Inferred Data),指的是以用戶貢獻數據或觀測數據為基礎通過復雜運算而獲得的衍生數據,如基于個人購買產品的傾向、信用評級等通過聚類算法或預測得出分類數據。貢獻數據主要是用戶自行創造生成,平臺向用戶收集并在平臺上展示,其應當是數據收集的投資并不存在太大爭議。觀測數據主要通過各種傳感器和智能設備生成,嚴格來講應屬于BHB案意義上數據創造的范疇,如2018年歐盟委員會《指令》評估報告指出:“在目前的情況下,《指令》似乎不適用于設備生成數據,這些數據庫的生成與其數據的創造密切相關,而判例法將對于內容創建的投資排除出了特別權利的保護。”對原始數據加工形成衍生數據的投資也應屬于數據創造投資的范疇。由此來看,實踐中真正需要保護的數據投資主要是數據創造的投資,如果在“數據財產權”制度中繼續堅持嚴格的數據收集和創造的區分,可能導致面臨類似于數據庫特別權利制度被“肢解”的困境。因此,可考慮改變該區分原則,適應大數據發展的現實,保護企業在數據生成、收集、加工中付出的實質性投資。
(2)受保護投資的條件。從保護和鼓勵投資的制度目標出發,投資應達到一定程度才受法律保護。特別權利保護要求數據庫制造者必須付出了“實質性投資”,歐盟立法并未對此作出明確的最低要求,實踐中一般采取“最小排除規則”(de minimis exclusion rule),只要投資并非是微不足道的,則給予特別權利保護,這可以從定量的角度加以認定,即可量化的人力物力資源投入達到一定的量;或者從定性的角度加以認定,即付出的人力物力投入產生了較高品質。歐盟各國法院對此采取了較低標準,如德國聯邦最高法院在案例中認可4000歐元的投資即屬于“實質性投資”,在意大利,羅馬法院裁定,當事人在數據庫中插入4000條記錄,然后對收集到的數據進行調整、修訂,需要付出一定金錢和時間成本,即屬于“實質性投資”。然而,在大數據保護中,“實質性投資”標準過低可能導致公有領域被侵占的風險,在將數據創造投資納入保護范圍后更是如此,例如,整個集合數據條目較少,某一企業在創建單個要素或數據條目付出了較多投資,按照“最小排除規則”就有可能被納入保護,若如此將導致一些不應受保護的事實性信息數據繞過版權法的限制而獲得財產權保護,進一步限制公共領域的行動自由。因此,本文贊同“實質性投資”應堅持相對高標準,它雖然直接無法量化,但從調整市場競爭的角度,只有企業收集具有實質數量的數據條目進而產生實際價值或者競爭優勢時,才具有保護的必要性。如日本《不正當競爭防止法》規定,只有相當數量積累而具有價值的數據才受到保護,可綜合考慮累積產生數據的附加值、利用的可能性、交易價格以及投入收集和分析付出的勞動力、時間、成本等進行判斷。數據財產權保護投資標準的界定也應采取此標準。
(二)“數據財產權”保護權能
“數據財產權”建構的核心之一是要界定權利的排他范圍從而解決大數據投資的“搭便車”和市場失靈問題,特別權利制度提供了針對數據利用形式設立排他權的現實參照,不過從數據庫到大數據的技術變革不僅僅改變了客體形式,同時改變了數據利用的商業模式,特別權利保護模式是否仍然有效有待檢驗。立足大數據保護的現實問題,可首先分析特別權利權能的適應性及問題,進而以此為基礎探索“數據財產權”的權能建構。
具體而言,在大數據時代,數據收集、分析技術進步幾乎引發了所有產業部門的數字化轉型:互聯網經濟下,網絡平臺可以通過提供數字內容吸引用戶注意,同時收集用戶數據,借助大數據分析實現供需精準匹配,并通過海量數據提升平臺算法質量;傳統工業也經歷著由傳統制造向物聯網、智能制造的轉型,企業可以通過傳感器收集用戶行為、設備、環境數據并進行實時分析,以節能或者提升產量的方式提升工廠或者商店運營效率,或者將分析結果用于開發新產品或者現有產品的改進。因而數據已成為企業在數字經濟中的競爭力來源。在數據收集、利用以及處分的商業鏈條中,網絡平臺或者智能設備制造商可以投資生成或者收集原始數據,直接進行數據分析利用或對外轉讓;對競爭者、數據分析企業等數據獲取相關主體,除了與數據收集者協商進行數據共享或購買數據產品外,由于數據利用過程的公開性以及數據的非競爭性、非排他性特點,不可避免地出現他人未經數據收集者允許獲取、利用數據的情形,而導致實踐中數據收集者與相關利益主體之間的系列糾紛。根據數據獲取、利用的模式不同,大數據實踐糾紛可分為典型類型:第一,未經授權獲取網上公開數據。絕大多數內容平臺上的用戶貢獻數據,其價值實現以完全公開或限制公開為前提,競爭者可通過網頁爬蟲爬取網頁數據。第二,在開放平臺的情形下,他人未經授權或超出授權爬取數據。除貢獻數據必須對外公開才能利用外,企業可將觀測數據等存儲于服務器上施加技術措施保護而保持對數據事實上的控制,其可以選擇對數據進行獨占性利用,也可通過交易共享實現數據價值最大化。實踐中,國內大多數大型互聯網平臺向第三方應用開放應用程序接口(API),通過差別化公開、限定公開的方式向不特定主體進行數據共享,同時也出現他人未經授權、超出授權獲取數據的情形。第三,對數據衍生產品進行傳播和轉售的行為。除直接對數據進行利用或轉售獲利,企業還可以對數據進行分析生成衍生數據、開發數據產品,由于數據可以非競爭、非排他可以無限復制的特點,他人可能通過產品復制、賬號分租等形式對數據產品進行轉售而不當獲利。
事實上,特別權利制度在構建之初即需要面對不斷發展的數據收集和分析技術,故在權能構造上,相對于著作權等傳統知識產權,其排他行為的類型化程度相對模糊,從保護投資的目標出發為數據庫提供了一種相對寬泛的保護,而存在對當前大數據實踐糾紛規制之潛能。具體而言,特別權利包括排除他人對數據庫內容的“提取”和“再利用”兩項權能,除了對單個數據或者非實質性部分不予保護外,特別權利保護涵蓋了所有未經允許復制以及向公眾傳播數據庫內容而損害投資者投資的情形,根據歐盟法院的解釋,《指令》的立法目的是保護收集、驗證、提供數據過程中進行的實質性風險投資,保護其投資結果不受任何未經授權的占用,從該目的出發,“提取”應理解為指任何未經授權的占用數據庫全部或部分內容的行為,其是否直接從權利人處獲得、以電子或手抄方式獲得、是否與原數據庫存在競爭等在所不問。關于數據“再利用”,指的是通過發行、出租、在線傳輸或其他傳輸方式,將數據庫的全部或部分內容向公眾傳播。任何以權利人同意之外的方式向公眾提供數據庫內容的行為都應被禁止,并不要求一次性向公眾傳播數據庫的全部/實質部分內容,只要不特定主體可以持續訪問數據庫的全部/實質部分,因其實質剝奪了權利人回收投資成本的機會即構成侵權。
特別權利制度之下的“提取”和“再利用”權能涵蓋了直接或間接盜用數據庫實質性部分而對數據投資產生損害的情形。“數據財產權”與數據庫特別權利共同的目的均在于保護數據投資,因而理論上可以將特別權利的權能移植到“數據財產權”之下。在大數據利用的商業模式下,無論是開發數據產品或大數據分析,基本都涉及到提取和再利用,未經允許對大數據集合的獲取和利用行為也將落在“提取”和“再利用”的范圍之內。就前述實踐中三類典型糾紛情形而言:第一,針對未經授權爬取網上公開數據的情形,如在大眾點評訴百度案中,百度通過網絡爬蟲爬取大眾點評服務器上大量數據而存儲到自身服務器中進行分析利用,必然會涉及對數據庫實質部分的“提取”,同時進一步將該數據在自身網站上展示,則將侵犯數據庫制作者的“再利用”權利,此外,若第三人進一步從百度公司處獲取相關數據進行分析利用,將同樣構成對大眾點評“提取”和“再利用”排他權利的侵犯;第二,針對開放平臺中未經授權、超出授權爬取數據的情形,如在騰訊訴抖音、多閃案中,抖音公司超出騰訊公司授權抓取用戶信息并在其應用中進行提供,雖然每次抓取限于用戶個人信息,但該公司以重復和系統的方式進行抓取,將構成對數據庫實質部分的“提取”和“再利用”;第三,針對傳播數據衍生品的行為,如在淘寶訴美景案中,美景公司組織用戶分享賬戶、出租賬戶查看淘寶產品數據,雖然并未涉及對數據庫內容復制或“提取”,但在數據庫制造者預期之外向新公眾提供了數據庫的訪問,而侵犯了數據庫制作者的向公眾傳播權或“再利用”的權利。
在新的技術條件下,數據庫特別權利的“提取”和“再利用”權能體現出了較強的制度張力,現有大數據實踐糾紛均可為特別權利的“提取”和“再利用”權能所涵蓋,可以實現糾正市場失靈而保護投資和促進創新的功能。因此,“數據財產權”可參照數據庫特別權利確定“提取”和“再利用”兩項權能,禁止他人未經允許復制、向公眾傳播數據集合的全部或實質性內容。
(三)“數據財產權”限制與例外
數據財產法律制度構建不僅要為數據投資提供充分保障,同時要兼顧競爭保障和公共利益平衡。因為數據具有較強的公共性,信息壟斷風險是數據保護立法面臨的“先天不足”,也是最難點。數據庫權利保護制度在建立之初即因此飽受爭議,因為在版權法中長期存在的基本原則是對于事實信息和原始數據不予保護,而特別權利突破了這一原則,依據企業在數據收集、訂正和展示過程中的投資,為事實性數據提供了一種排他權的保護,存在著阻礙信息自由流動和壟斷風險,尤其對于獨家來源數據的情形,特別權利保護將會完全排除二級市場的競爭。因此,歐盟法院在BHB等案中通過數據創造與數據收集的區分限縮了特別權利的適用范圍;在歐盟委員會2005年對《指令》的第一次評估中,由于《指令》在促進歐盟數據庫產業發展方面的效果并不理想,曾考慮過廢除整個《指令》、取消特別權利制度或者修改特別權利制度,最終基于產業阻力和政策考量選擇了維持現狀。建立“數據財產權”,最直接的問題仍然是對數字市場競爭和數據自由流動的潛在限制。有學者擔憂,因為大數據價值實現的最大化在于數據共享和再利用,以特別權利的模式對于大數據集合過于寬泛的保護,會排除相關利益主體的合理使用,并限制數據流動和再利用。
在歐盟《指令》立法之初,由于數據的公共屬性,歐共體委員會在草案中確立了特別權利十年的保護期限,并規定了較為嚴格的特別權利例外和強制許可制度。草案提交到歐共體理事會后,歐盟理事會從鼓勵建立強大的數據庫產業這一目標,采取了“高標準、嚴保護”的立法思路,如經濟與社會委員會在提交給歐共體理事會的意見中提出:“某種客體是否應該被保護?通過規定短期限的知識產權保護并附加強制許可來對這個問題進行妥協是錯誤的。更可采取的辦法是,判斷它是否符合保護的條件,如果符合,就賦予其高標準的知識產權保護。”因此,《指令》將保護期限延長為15年,刪除了強制許可限制,并僅規定了兩項例外:1.第8條規定,對于數據庫的非實質性部分,數據庫制作者不得阻止合法用戶的提取和再利用,但是這種使用不得與數據庫的正常利用相沖突,也不得損害數據庫制造者的合法利益。由于特別權利保護的范圍僅限于數據庫的實質部分,該條規定用戶可提取或再利用數據庫的非實質部分,并不具有實質的限制或例外意義,被認為在事實上是多余的;2.第9條規定了特別權利保護的例外情形,允許成員國可規定不經授權直接對數據庫實質內容提取和使用的情形:在為私人目的提取非電子數據庫內容;在標明來源的前提下,基于教學或者科學研究的非商業目的在合理范圍內提取;以及為了公共安全、行政司法程序而提取或者再利用數據庫內容。
首先,關于權利例外,雖然《指令》第9條規定了數據庫保護的例外,但對比版權法上的保護例外,特別權利的保護例外情形要狹窄得多,且版權法上的限制和例外情形無法在數據庫特殊保護中適用。實踐中,相關例外情形在促進數據合理利用中作用十分有限,如私人使用僅限于紙質數據庫,在《指令》制定之時電子數據庫還并未普及,該條具有一定適用意義,但在信息時代其已經成為具文,除此之外,教學科研例外以及因行使公共職權的例外在實踐之中也較少地被援引。作為促進數據流通利用的完善方案,有學者主張應當在版權保護和數據庫特別權利之間建立動態聯系,將《信息社會版權指令》第5條規定的限制例外情形適用于特別權利,并將數據與文本挖掘等新版權立法中規定的限制情形在適當條件下自動適用于特別權利。然而,作者權體系下著作權的限制例外情形相對封閉,其中很大部分并不適用于當前大數據的分析利用場景,而且新的數據分析應用模式在不斷產生。在“數據財產權”構建中,若為平衡公共利益保留充分的空間,則不建議引用作者權體系下著作權的限制例外情形,可考慮引入美國版權法上合理使用(fair use)的判斷框架,在為數據投資提供寬泛保護的前提下,對不斷出現的涉及公共利益的數據提取和再利用行為根據以下要素綜合判斷“合理”:(1)使用的目的與性質;(2)數據集合的性質;(3)所使用部分的質、量及在整個數據集合中的占比;(4)對數據集合的潛在市場或價值產生的影響。如果構成合理使用則不構成侵權。
其次,關于權利限制,通過后的歐盟《指令》并未對數據庫特別權利設置有效的限制。但在該制度的歷史建構過程中,由于數據的公共屬性,在1992年立法之初,歐共體委員會已經考慮到了對于特別權利保護單一來源數據可能對二級市場造成的潛在影響,從而在數據庫保護指令制定的提案中規定了強制許可制度,該提案規定了“向公眾提供的數據庫中所包含的作品或材料無法獨立地創建、搜集或者從其他來源獲得”的情形以及公共機構編制的公開數據庫應當以“公平和無歧視”的條款對外進行強制許可,并規定了成員國內部的仲裁機制,兼顧與個人數據、隱私、數據安全和保密之間的利益平衡。在歐共體理事會采取“高標準、嚴保護”的立法思路后,該制度最終被刪除。歐盟法院在2004年BHB案中通過數據創造與收集的區分大幅度限縮了特別權利的保護范圍,旨在避免單一來源數據壟斷問題。在“數據財產權”制度構建中,如前所述,從避免市場失靈的制度目的出發,不僅僅應保護數據投資也應當保護數據生成的投資,不可能避免地將會導致數據收集者對單一來源數據壟斷,從而限制或排除二級市場競爭。對此,可引入1992年《指令》草案中的方案來限制權利化解壟斷問題,即對單一來源數據集合,權利人有義務通過公平、合理、無歧視的條件進行對外許可。
最后,權利保護期限問題。知識產權保護目標在于促進創新,它以公共領域與私人領域之間進行交換并相互增益而實現公有知識領域的擴張和進步,因此私有知識產權保護必然要遵循一定期限限制,保護期限屆滿后即必須回公共領域,唯有如此,該知識領域才會不斷豐富。然而,如何界定數據的保護期限卻面臨著現實困難。在數據庫特別權利保護中,《指令》第10條規定,數據庫的保護期限為15年,如果因實質性新的投資導致數據庫內容發生實質性改變,其保護期限將重新起算。對大數據集合而言,與一般數據庫的開發和利用時期相比,其具有較強的時效性,15年的保護時間過長;同時,在數字經濟環境下,動態數據庫越來越多地取代靜態和離線數據庫,由于其不斷進行更新,因此將面臨著權利人對數據庫永久享有保護的問題。適應數據分析利用的時效周期,可將“數據財產權”保護期限定為相對較短的5年,從而在鼓勵投資與公有知識領域增長之間建立平衡;同時,對于持續性更新的數據庫,法律應當明確僅對更新的實質部分進行有限的保護,對于舊的數據庫內容應當為公眾免費提供。
(四)小結
綜上所述,在假設采取財產權保護模式的前提下,可借鑒歐盟數據庫特別權利的實踐,確定“數據財產權”的基本制度框架,即相關主體在數據生成、收集、加工中付出實質性投資,使得數據產生相當數量累積而產生實質性價值時,則投資者對由獨立數據、作品或素材組成的數據集合享有“數據財產權”,其中包括禁止他人提取和再利用數據集合實質或全部內容的排他性權利,“數據財產權”的保護期限可定為5年。同時,如果他人的數據提取或再利用行為屬于“合理使用”,將不構成侵權,對于單一來源數據,權利人有以公平合理無歧視條件對外許可的義務。
三、“數據財產權”制度反思及建議
當前,大數據保護采財產權保護或行為法保護模式尚處于爭論之中,唯有明確“數據財產權”的理想制度設計,方能在不同路徑之間作出衡量和選擇。數據庫特別權利制度是對非獨創性數據提供財產權保護的最早立法實踐,可資借鑒。
(一)保護路徑:暫不設立數據財產權而延續反不正當競爭法保護
關于大數據產權保護路徑的爭論,主要圍繞財產權為主導的權利規制路徑與反不正當競爭法規制主導的行為規制路徑模式展開。欲作出路徑選擇,必先厘清兩種保護路徑之間的區別關系并對比其優劣勢。
這種區分討論數據產權保護制度并不具有直接建構意義,因為在傳統財產權觀念下,財產權的構建模式是由客體界定權利,將財產權理解為對客體即物的絕對性支配,從而可直接套用物權模式而建構占有、使用、收益、處分權能。現代財產觀念中,已普遍接受霍菲爾德財產權本質是對人性而非對物性的理論,即財產權并非是對某物的絕對性支配,而是調整人與人之間的不特定性權利,財產權在現實主義的概念化和去結構化之后,不再受其客體的束縛而成為一種對世性權利的“權利束”,將這一系列權利組合到一起形成“財產權”的意義在于以符合社會觀念的方式進行“模塊化”處理可以降低社會交易成本。因此,數據產權保護的核心不在于權利法與行為法的形式區分,而在于如何能恰當地厘定和發現權利人對世地排他性使用與公眾合理利用的邊界。
在發現這一邊界的過程中,反不正當競爭法保護與權利保護之間具有一定功能區分和漸進式演進關系。二者之間都遵循著功利主義目標,即保護企業投資成果而防止競爭失靈,但依據市場失靈的確定性和對第三人造成不利影響的可能性,法律依次提供不同強度的保護:依據一般條款考量各種因素進行利益平衡、排除特定行為、提供模塊化權利保護、提供絕對的排他權保護。在此過程中,反不正當競爭法保護承擔著新型權利“孵化器”的作用,可以在一般原則框架之下靈活地對特定投資成果之上不正當競爭行為進行規制,經過司法實踐不斷類型化發展成熟,進而通過模塊化的方式組合成為固定的權利束,轉化成為一類新的知識產權或新型財產權。
權利保護所具有的封閉性和確定性特點決定了在一項法益產生初期不應當急于將其確立為一項知識產權或財產權,因為盡管在保護需求出現之初,權利化保護可能為特定產業或者利益相關者所強烈呼吁,但一旦對于特定客體或授予知識產權保護擴大保護范圍,即難以退回到之前的保護狀態。歐盟數據庫保護即存在此問題,在數據庫出現之后,歐盟為了促進數據庫產業繁榮,急于為數據庫確立一種財產權利,事后發現數據庫特別權利在促進歐盟數據庫產業發展方面的效果并不理想,歐盟雖然曾考慮過廢除整個《指令》、取消特別權利制度或者修改特別權利制度,最終基于產業阻力和政策考量選擇了維持現狀。
因此,是否建構“數據財產權”或繼續采用反不正當競爭法保護,關鍵看現實條件能否滿足權利保護所需的確定性要求。參照歐盟數據庫特別權利制度,從保護投資避免市場失靈出發,“數據財產權”禁止他人對大數據集合全部或實質部分未經允許的提取和再利用,可以滿足保護數據投資和激勵創新的功能,面臨的突出問題或風險仍然在于,過于廣泛的排他性權利會限制數據自由流動并造成數據壟斷,如何在數字經濟發展初期準確地識別各種合理使用利益而設置排他權的限制和例外,成為了適用財產權制度保護大數據的真正挑戰。將“數據財產權”與反不正當競爭法保護相對比,“數據財產權”保護的最大優勢在于企業投資保護的確定性,但在當前數據利用和交易實踐中,絕大多數數據處于企業事實控制之下,企業可以通過技術手段對數據提供第一層面的事實保護,即使針對部分公開數據以及突破技術措施不當獲取數據的情形,反不正當競爭法之下通過一般條款規制“搭便車”行為即可以實現對企業投資的有效保護,通過財產權保護的優勢并不明顯。與歐盟數據庫保護問題類似的是,大數據保護面臨的核心問題不在于如何為企業數據投資提供充分保護,而是如何在一般性地保護企業數據投資的前提之下識別各種合理利用需求設置保護例外,保障數據自由流動和再利用。當前大數據技術正處于發展初期,數據分析利用實踐正處于不斷發展演進之中,各種相關利益主體訴求難以被準確表達和平衡,因此無法全面和精確地提煉出有利于促進公共利益的限制和例外情形。雖然我們可以設置開放式條款為保障公眾的合理使用需求留有余地,然而,一旦在數據之上排他性地設置一種財產權,無疑將數據利用收益的所有可能都分配給了權利人所獨占,其他社會公眾如果想利用合理使用條款,需要承擔更強的論證義務,并面臨更高的法律風險和不確定性,有可能從一開始就扼殺這種合理使用產生的可能,難以實現數據分析利用價值的最大化,并對自由競爭產生阻礙。
因此,結合歐盟數據庫保護的經驗來看,我國不必急于在數據之上確立一類新的財產權利。當前正處于數字經濟發展早期,為避免財產權保護模式封閉和僵化的缺陷,我們應繼續在反不正當競爭法的框架下保護數據財產利益,充分發揮反不正當競爭法新型權利“孵化器”作用,將不斷發生的各種實踐糾紛置于反不正當競爭法的靈活框架下進行具體衡量,在防止“搭便車”的一般保護原則之下識別各種正當利益,通過大量司法案例積累,以類型化的方式提煉出各類不正當競爭行為和正當利用行為,在實踐檢驗基礎之上,將各類不當行為通過模塊化的方式組合成為固定權利束,最終確立一類新的財產權利。
(二)基于財產權探討對完善反不正當競爭法保護的啟示
雖然我國并不必急于設立新的“數據財產權”,但卻并非意味著“數據財產權”的討論毫無意義。如前所述,財產權保護與行為法保護模式之間的區別并非截然對立,只是保護確定性上有所不同。歐盟數據庫特別權利源于反不正當競爭法上的盜用原則(Doctrine of Misappropriation),前述“數據財產權”模型也根植于此,其與反不正當競爭法保護都致力于保護企業投資的共同制度目的,二者只是一般假設和保護確定性有所不同。因此,即使不采取財產權保護模式,而通過細化反不正當競爭法的一般條款進行保護,前述“數據財產權”保護客體、規制行為、限制例外的探討仍然具有意義,財產權保護模式下的相關要件,可以為反不正當競爭法的行為規制路徑所借鑒和吸收。基于此,現就反不正當競爭法下的大數據保護制度完善分析如下。
在我國司法實踐中,現有民法、知識產權法以及反不正當競爭法規定的不正當競爭行為類型都難以對數據盜用行為提供直接規制,法院主要適用反不正當競爭法一般條款進行調整。一般認為,不正當競爭行為成立應滿足存在競爭關系、行為違反誠信原則或公認的商業道德、損害競爭者的合法權益三個要件,在大數據保護司法實踐中,各級法院往往對于競爭關系作出寬泛認定,將裁判焦點聚焦于后者,其裁判思路可歸納為:1.確認數據收集者在數據收集過程中付出了實質性投資,大數據集合能為其帶來經濟利益和競爭優勢,因此數據收集者對其數據集合具有競爭法上的利益;2.競爭者未經數據收集者授權獲取數據的行為,損害了數據收集者的財產利益;3.該行為違反公認的商業道德而具有不正當性。由于一般條款具有高度的概括性和模糊性,反不正當競爭法保護在實踐中面臨著司法裁判標準不統一、不可預見以及競爭利益權利化的問題:第一,關于競爭者合法權益,企業雖然對其投資收集數據具有合法利益,在何種范圍內可以排除他人的獲取和利用,不同法院認定存在分歧。如在大眾點評訴百度案中,法院認為,百度公司用垂直搜索獲取大眾點評數據本身不具有違法性,但是其使用數據應當遵循“最少、必要”的原則,但百度公司大量抓取并實質替代了大眾點評的服務而構成不正當競爭;在騰訊訴抖音、多閃案中,抖音依用戶授權逐條抓取微信平臺的用戶個人數據,法院同樣認定可構成不正當競爭。在一般條款之下,企業采取何種行為、在何種范圍或程度抓取他人數據構成不正當競爭行為尚待明確。第二,關于行為不正當性判斷存在不同標準。例如,在大眾點評訴百度案中,法院認定,百度公司垂直搜索獲取大眾點評數據本身不具有當然違法性,但當其構成實質性替代即存在市場失靈的風險時才認定構成不正當;在“酷米客”訴“車來了”案中,法院概括地認定企業對其投資收集數據具有合法權益,第三人未經允許的數據爬取行為系“不勞而獲”“食人而肥”的行為,具有不正當性。對此,有學者認為,現行司法實踐試圖激活反不正當競爭法一般條款中的“合法權益”而確立事實上的“數據財產權”,但這卻是一種僅保護投資者利益而對利益相關主體缺乏充分考量的“財產權”模式,就其保護限制、例外卻缺乏精確的利益考量。
針對當前反不正當競爭法一般條款適用過于概括和模糊的問題,我國雖并無必要設立專門財產權制度,但卻可借鑒“數據財產權”討論的成果將一般條款的適用具體化,提升大數據集合法律保護的確定性:
1.數據集合保護條件及禁止行為。如果企業在數據生成、收集、加工中付出實質性投資,使得數據產生相當數量累積而產生實質性價值,為了保護投資和激勵創新,應當根據禁止盜用原則提供保護,禁止盜用他人數據投資的行為,包括禁止未經允許對大數據集合的不正當獲取和利用。關于獲取和利用可借鑒數據庫特別權利保護中“提取”和“再利用”的界定,獲取即將數據集合的全部或實質性部分永久或暫時轉移到另一載體上,再利用即以數據收集者預期之外的方式將數據集合內容向他人提供。從企業投資保護的角度出發,該保護既不應當排除一切數據抓取行為,也不應當僅限于對他人營業構成實質性替代的情形,而是排除他人對大數據集合全部或實質部分的抓取和利用,對非實質性部分的抓取和利用則不受法律保護。關于抓取內容實質性與否的判斷,可參照歐盟數據庫特殊權利保護的實踐,即并不取決于被獲取部分在整體數據集合中的比例,而是應從保護投資的目標出發,考察被抓取部分是否具有獨立分析和利用的價值。
2.正當獲取和利用數據的行為。為了避免利益保護過度而限制競爭,在根據禁止盜用原則為企業投資提供一般性保護的前提下,應當保護他人對數據的正當利用。在判斷競爭者數據獲取和利用行為正當與否時,可考慮引入版權法體系下開放性合理使用判斷標準。實踐中,如在阿里巴巴訴碼注公司案中,杭州濱江法院已考量相關因素判斷數據抓取行為正當與否:(1)使用行為的目的和特點,包括數據使用的用途,是否有利于市場效率和社會利益;(2)被使用客體的性質,包括數據的公共屬性;(3)被使用部分的數量和質量,包括數據的抓取和使用是否超過合理限度;(4)使用對被使用客體潛在市場或價值的影響,包括數據抓取和適用行為是否對經營者利益產生實質影響。該裁判標準可供實踐參照,即如果相關行為符合合理使用標準,則不作為不正當獲取、利用數據的侵權行為。
3.數據集合保護的限制。在歐盟數據庫立法中,由于保護單一來源數據會排除二級市場競爭而受到高度關注,故在BHB案中歐盟法院將數據創造投資排除出保護范疇,而伴隨著該標準適用的松動,對單一來源數據的強制許可再次被提上議程。目前,我國適用反不正當競爭法一般條款保護數據投資同樣面臨著同樣問題,如在前述“酷米客”訴“車來了”案中,公交車數據具有較強的公共屬性,原告“酷米客”公司作為與深圳公交公司合作的唯一數據控制主體,如果將相關行為認定為不正當競爭,完全排除他人對數據的獲取無疑會造成二級市場即公交車信息服務的壟斷而消除競爭,司法實踐對此卻缺乏足夠關注。在數據保護實踐中應對單一來源數據作特別考量,由于企業在收集數據中同樣付出了實質性投資,完全將之排除在保護之外,將不利于該類數據的收集和利用。因此,在反不正當競爭法保護中,可采用歐共體委員會在1992年《指令》提案中的強制許可方案,對于未經許可爬取、利用單一來源數據的行為,人民法院可以認定相關行為構成不正當競爭,但不判定停止侵權,要求競爭者以公平、合理、無歧視條件向數據收集者支付合理費用。
(作者:張浩然,中國社會科學院法學研究所助理研究員。)