RM新时代平台足球

爬蟲(chóng)技術(shù)應用合法性引爭議 亟待規制非法爬取數據行為
發(fā)布時(shí)間:2021-11-09 來(lái)源:法治日報
  爬蟲(chóng)技術(shù)應用合法性引爭議

  保障數據安全亟待規制非法爬取數據行為

  核心閱讀

  在大數據時(shí)代的背景下,愈來(lái)愈多的市場(chǎng)主體投入巨資收集、整理和挖掘信息。如果任由網(wǎng)絡(luò )爬蟲(chóng)任意使用他人通過(guò)巨大投入獲取的數據資源,將不利于鼓勵商業(yè)投入、產(chǎn)業(yè)創(chuàng )新和誠實(shí)經(jīng)營(yíng),甚至可能直接違背了數據來(lái)源用戶(hù)的意愿和知情權,最終勢必損害健康的競爭機制。

 

  隨著(zhù)社會(huì )經(jīng)濟的快速發(fā)展,數據的價(jià)值日益凸顯,已然成為企業(yè)科技創(chuàng )新的必備要素。但企業(yè)通過(guò)技術(shù)手段獲取數據時(shí),數據抓取技術(shù)的應用行為是否合理合法,是一個(gè)值得深思的問(wèn)題。

  近年來(lái),網(wǎng)絡(luò )爬蟲(chóng)“爬取數據”成為熱詞,相關(guān)司法案例不斷出現。據不完全統計,近些年涉及網(wǎng)絡(luò )爬蟲(chóng)的司法案件達十余起,其中既包括民事案件,還包括刑事案件。這類(lèi)案例甚至還有愈演愈烈之勢。

  在近日于上海舉行的長(cháng)三角數據合規論壇(第三期)暨數據爬蟲(chóng)的法律規制研討會(huì )上,上海市人民檢察院研究室副主任陳超然透露,檢察機關(guān)正在積極推動(dòng)企業(yè)合規改革試點(diǎn)工作,數據合規正是其中重點(diǎn)。“目前爬蟲(chóng)爬取數據案件非常普遍,當網(wǎng)絡(luò )平臺或者個(gè)人通過(guò)技術(shù)手段抓取別的平臺數據時(shí),這種行為是否合法,平臺數據主體是誰(shuí),歸誰(shuí)使用,值得深入研討。”

  杭州長(cháng)三角大數據研究院副院長(cháng)郭兵認為,數據爬蟲(chóng)作為中立性的技術(shù),已在互聯(lián)網(wǎng)產(chǎn)業(yè)領(lǐng)域得到廣泛應用。需要注意的是,如果爬蟲(chóng)技術(shù)不當應用,會(huì )對其他競爭者的合法權益造成損害,甚至涉嫌違法或者犯罪,也將對產(chǎn)業(yè)的健康發(fā)展產(chǎn)生非常大的負面影響。

  爬取數據涉嫌侵權

  從技術(shù)角度看,爬蟲(chóng)是通過(guò)程序去模擬人類(lèi)上網(wǎng)或者瀏覽網(wǎng)頁(yè)、App行為,讓其高效地在網(wǎng)上抓取爬蟲(chóng)制造者所需要的信息。

  歐萊雅中國數字化負責人劉煜晨說(shuō),大多數網(wǎng)站拒絕爬蟲(chóng)訪(fǎng)問(wèn),其中的原因既包括商業(yè)利益考量,也包括自身網(wǎng)站運營(yíng)安全的考量。除了爬蟲(chóng)可能爬到網(wǎng)站不愿被爬取的數據以外,網(wǎng)站經(jīng)營(yíng)者往往還會(huì )擔心爬蟲(chóng)干擾網(wǎng)站正常運營(yíng)。

  而非正規爬蟲(chóng)自動(dòng)持續且高頻地對被爬取方進(jìn)行訪(fǎng)問(wèn),服務(wù)器負載飆升,也會(huì )給服務(wù)器帶來(lái)“難以承受”之重:應對經(jīng)驗不足的網(wǎng)站,尤其是中小網(wǎng)站可能會(huì )面臨網(wǎng)站打不開(kāi)、網(wǎng)頁(yè)加載極其緩慢、有時(shí)甚至直接癱瘓的情況。

  新浪集團訴訟總監張喆說(shuō),無(wú)論是爬蟲(chóng)還是實(shí)現其他目的的技術(shù),就其本身而言,都是中立的,但爬蟲(chóng)技術(shù)的應用不是中立的,技術(shù)應用都帶有應用者的目的。這時(shí)候不應該評價(jià)技術(shù)原理,而是需要評價(jià)技術(shù)用來(lái)干什么,這一行為手段是否具有正當性。

  提及網(wǎng)絡(luò )爬蟲(chóng),robots協(xié)議是繞不開(kāi)的話(huà)題。robots協(xié)議(也稱(chēng)爬蟲(chóng)協(xié)議)的全稱(chēng)是“網(wǎng)絡(luò )爬蟲(chóng)排除標準”,網(wǎng)站通過(guò)robots協(xié)議明確警示搜索引擎哪些頁(yè)面可以爬取,哪些頁(yè)面不能爬取。該協(xié)議也被行業(yè)稱(chēng)為搜索領(lǐng)域的“君子協(xié)定”。

  劉煜晨說(shuō),當網(wǎng)絡(luò )爬蟲(chóng)訪(fǎng)問(wèn)一個(gè)網(wǎng)站,robots協(xié)議像立在自己房間門(mén)口的一個(gè)牌子,告訴外來(lái)者誰(shuí)可以過(guò)來(lái),誰(shuí)不可以過(guò)來(lái)。但是,這只是一個(gè)君子協(xié)議,只能起到告示作用,起不到技術(shù)防范作用。

  實(shí)踐中,惡意爬蟲(chóng)爬取時(shí)不遵守網(wǎng)站的robots協(xié)議,并可能爬取到不該爬的數據,這種情形并非孤例。小紅書(shū)法務(wù)負責人曾翔說(shuō),惡意爬蟲(chóng)案例經(jīng)常發(fā)生在內容平臺和電商平臺。在內容上被爬取的更多是視頻、圖片、文字、網(wǎng)紅互動(dòng)數據、用戶(hù)行為等,在電商領(lǐng)域則多為商家信息和商品信息。

  “內容平臺一般約定了相關(guān)內容知識產(chǎn)權歸發(fā)布者或者發(fā)布者和平臺共同所有,這些爬蟲(chóng)沒(méi)有簽訂協(xié)議就獲得用戶(hù)授權,涉嫌對知識產(chǎn)權人權利的侵犯。”曾翔說(shuō)。

  或應明確網(wǎng)站權利

  這就涉及到數據的權屬及是否能開(kāi)放的問(wèn)題。

  上海市浦東區人民法院知識產(chǎn)權庭法官徐弘韜認為,數據是內容產(chǎn)業(yè)的核心競爭資源,內容平臺經(jīng)過(guò)匯總分析處理后的數據往往具有極高的經(jīng)濟價(jià)值。

  “如果要求內容平臺經(jīng)營(yíng)者將其核心競爭資源向競爭對手無(wú)限開(kāi)放,不僅有違‘互聯(lián)互通’精神的實(shí)質(zhì),也不利于優(yōu)質(zhì)內容的不斷更迭和互聯(lián)網(wǎng)產(chǎn)業(yè)的持續發(fā)展。”徐弘韜說(shuō)。

  惡意爬蟲(chóng)爬取數據案件頻發(fā)的背后,是數據的價(jià)值增加,以數據為核心的市場(chǎng)競爭愈發(fā)激烈。

  華東政法大學(xué)教授高富平說(shuō),進(jìn)入大數據時(shí)代,數據價(jià)值再次凸顯,現在的爬蟲(chóng)技術(shù)已經(jīng)從原來(lái)的網(wǎng)頁(yè)爬蟲(chóng)進(jìn)入到底層數據的爬取。數據爬蟲(chóng)問(wèn)題會(huì )變得越來(lái)越嚴重。

  在大數據時(shí)代的背景下,愈來(lái)愈多的市場(chǎng)主體投入巨資收集、整理和挖掘信息,業(yè)內人士對此表示擔憂(yōu):如果任由網(wǎng)絡(luò )爬蟲(chóng)任意使用或利用他人通過(guò)巨大投入所獲取的數據資源,將不利于鼓勵商業(yè)投入、產(chǎn)業(yè)創(chuàng )新和誠實(shí)經(jīng)營(yíng),甚至可能直接違背了數據來(lái)源用戶(hù)的意愿和知情權,最終勢必損害健康的競爭機制。

  高富平認為,如果網(wǎng)站合法積累數據資源,那么這些數據資源就應該屬于網(wǎng)站的資產(chǎn)。“允許數據生產(chǎn)者、控制者基于商業(yè)目的開(kāi)放數據是有好處的,通過(guò)許可使用、交換交易等方式,可以讓更多人享用數據服務(wù)。期待在未來(lái)確認數據所有合法生產(chǎn)者對數據的控制權、使用權。”

  有序流轉同等重要

  目前,網(wǎng)站雖然可以去指定相應策略或技術(shù)手段,防止爬蟲(chóng)抓取數據,但爬蟲(chóng)也有更多技術(shù)手段來(lái)反制這種反爬策略。

  劉煜晨說(shuō),反爬和爬取的技術(shù)一直在迭代,在技術(shù)領(lǐng)域,沒(méi)有爬不了的網(wǎng)站和App,只有愿不愿意爬和多難爬的問(wèn)題。

  據了解,現實(shí)中惡意網(wǎng)絡(luò )爬蟲(chóng)制造者抗辯時(shí),往往將robots協(xié)議限制爬取與數據流轉聯(lián)系起來(lái)。徐弘韜認為,在“互聯(lián)互通”的語(yǔ)境下,“有序”和“流轉”同等重要、缺一不可,需排除假借“互聯(lián)互通”妨礙公平競爭、危害用戶(hù)數據安全的行為。

  “對于非搜索引擎爬蟲(chóng)的正當性判別,要考慮是否足以保障用戶(hù)數據的安全性。包括身份數據、行為數據等在內的用戶(hù)數據,從屬性來(lái)講不僅僅是經(jīng)營(yíng)者的競爭資源,同樣具有用戶(hù)的個(gè)人隱私屬性,而此類(lèi)數據的集合更涉及社會(huì )公共利益。”徐弘韜說(shuō)。

  據了解,近年來(lái)有關(guān)數據安全的法律規范正在不斷完善中。數據安全法作為數據安全的基本法,承載著(zhù)解決我國數據安全核心制度框架的重要任務(wù)。此外,還有2019年通過(guò)的密碼法,工信部擬出臺《工業(yè)和信息領(lǐng)域數據安全管理辦法(試行)》等,一些地方如深圳、上海等也在探索制定數據管理相關(guān)規范。


編輯:薛姣

RM新时代平台足球
rm新时代跑路 RM新时代成立多久了 rm官网怎么登录 RM新时代注册 RM新时代正常可以出正常提 RM新时代专业团队|首入球时间 rm新时代公司官网 rm官网 RM新时代资金盘 RM新时代正规网址|首入球时间