2019亚洲日韩新视频_97精品在线观看_国产成人精品一区二区_91精品网站在线观看

深度合成待證數據的風險剖析與辨識機制

來源:期刊VIP網所屬分類:免費文獻發布時間:2021-08-02瀏覽:

  摘 要:數字經濟新產業、新業態和新模式獲得加速培育的全新場景下,滲透千行百業的數據信息深度合成技術在 提高生產效率、改善生活質量、助力經濟社會發展的同時,眾多惡意應用亦嚴重威脅個人權益、政治安全、社會穩定和國家安全等等。 文章從深度合成數據的概念與類型入手,結合待證數據的特質與現行采信模式,集中探討了深度 合成待證數據影響鑒真算法實效、引發漣漪式信任衰退、威脅安全體系等關鍵性風險,進而提出嚴格遏止源頭違規、重塑專家鑒定模式、加強環境經驗支撐等一系列健全辨識機制的方式方法。

  關鍵詞:深度合成;待證數據;風險剖析;辨識機制

  Abstract On one hand, the technology of data deep synthesis, which has been used in thousands of industries, improves the production efficiency and the quality of life, and helps the economic and social development. On the other hand, many malicious applications also seriously threaten personal rights, political security, social stability and national security. This paper starts with the concept and classification of data deep synthetic, combined with the characteristics of data to be proved and the current criteria of the accepting, focuses on the key risks in affecting the effectiveness of authentication algorithm, causing trust decline, infringing personal rights and interests, and threatening the security system. Then, it put forward a series of methods, such as strictly curbing source violations, reshaping the expert witness, and strengthening the supporting mechanism of circumstantial experience.

  Key words deep synthesis; data to be proved; risk analysis; identification mechanism

  隨著第五次科技革命和第三次產業革命深入推 進, 迅速滲透社會生活方方面面的人工智能技術應

  用和開放的海量數據有序流動成為新時期培育新產 品、打造新業態的關鍵支撐。 2020 年 3 月 30 日,《中 共中央、 國務院關于構建更加完善的要素市場化配 置體制機制的意見》 勾勒了加速培育各領域數據高 效開發利用和數據資源有序流動的數據要素市場的具體方案,既釋放出巨大的信息紅利、高質量助推智 能社會構建, 亦暴露出迭代更新的先進產品持續引 發諸多新型風險。 如短短三年間,深度合成數據技術的主要產出形式已經從肉眼可以識別的粗糙拼接物 發展為“多重軟件檢測+人工復檢”仍然難以辨識的 仿真精品①。

  隨著 《新一代人工智能發展規劃》《促進新一代人工智能產業發展三年行動計劃 (2018-2020 年)》《關于促進人工智能和實體經濟深度融合的指導意 見》等貫徹落實,深度合成數據產品的制作成本大幅 降低而仿真水平迅速提升, 致使基于人工智能程序 和深度學習算法的數據內容合成類違規制品以幾何 乘數泛濫成災,不僅給社會監管帶來巨大困難,嚴重威脅自然人的人身安全和財產安全1,一定程度上甚至阻滯了作為人權保障最后手段的規則救濟的有序運轉2。尤其是在將運用深度合成技術偽造的數據信息作為待證資料的特殊場景下,“如果證據規則跟不上人工智能技術發展的腳步,公民的基本權益和程序正義面臨的風險將大幅增加。"D亟待以《新一代人工智能治理原則》的八項治理原則為軸心,結合《數據安全法(草案)X人工智能標準化白皮書》等,搭建具象場景中人工智能應用治理的實踐方案。

  1深度合成數據的概要分析

  雖然美圖秀秀、會聲會影、Adobe Photoshop等應用程序嵌入了修改數據內容的功能,但通過生成對抗網絡(GAN)的機器學習周期進行的以極端逼真的方式重塑現實的數據深度合成可以學習模仿任何數據分布,能夠創造出與現實世界極其相似的虛擬世界。

  自美國著名科技媒體網站“主板"(Motherboard)

  首次曝光深度偽造色情視頻的事件以來,社會各界飽受深度合成技術暗黑面的困擾)。雖然全球主要站點大力封禁深度偽造的色情制品或政治人物音視頻[5],但持續走低的制作成本和不斷降低的發布難度以及互聯網固有的零邊界、匿名化、娛樂性等特質使得惡意行為者不僅能夠在同一站點反復發布且可以在互聯網管制死角不斷創建和傳播各類偽造的數據制品1)嚴重威脅個人權益、社會穩定、政治和國家安全等。

  事實上,信息時代的數據深度合成(Deep Syn-thesis)本身是一個中性概念,泛指借助深度學習算法模型等智能化方案自動生成文本、圖像、語音、視頻等數據內容的一系列處理技術。

  一方面,數據深度合成的正向應用將創建的虛擬角色、聲音模擬、視頻渲染等廣泛應用到娛樂文化、社交通訊、醫療保健等眾多場景之中,提升音視頻制作的效率與質量,建立使用者的社交數字化分身,還原歷史人物或故去親友的肖像,提升醫學影像精度,彌補聽力缺陷等。如2020年全國兩會期間,搜狗公司聯合新華社發布了通過語音、表情、唇動、肢體動作等數據深度合成的算法實時驅動的全球首個動態3D虛擬主播“新小微”,更好地滿足新聞呈現多樣化的需求,推動智能化的媒體融合"。

  另一方面,數據深度合成的負向應用,亦稱深度偽造(Deepfake),通過文本數據重組、表情數據遷移、動作數據遷移等方式生成表面上高度可信的仿真制品,傳播虛假信息,操控受眾反應,嚴重威脅整個社會的安全體系與保障機制)。如FakeApp.Face Wap DeepNude等一鍵合成不雅內容的應用程序引發各界爭議2:又如,深度合成馬斯克、奧巴馬、默克爾、佩羅西等歐美名流政客的虛假視頻引發廣泛的信任危機和安全憂慮。

  總體而言,基于深度學習的數據合成技術主要應用在文本合成、視覺合成、聽覺合成等三大領域。深度文本合成和視覺合成因循數據收集、模型訓練、偽造內容等核心步驟創造虛擬數字人及其所處的生態環境。深度聽覺合成則主要采用拼接式語音合成或基于參數估算的合成方法重塑現實。相關戲仿性應用產品迅速迭代,難以精準及時地予以鑒識3,亟待構建和完善規模化的規制體系。

  2待證數據的采信難題

  證據是認定案件事實的基礎和關鍵。21世紀以來,隨著運用計算機工具的違法犯罪模式日趨多樣化并呈現出高速增長的態勢,以二進制編碼記載的能夠證明案件事實的數據愈加繁雜,立法部門開始關注電子證據的相關性、真實性、合法性及其證明值等等。 《計算機犯罪現場勘驗與電子證據檢查規則》 首次以列舉方式明確指出電子數據、 存儲媒介和電 子設備皆是電子證據這一全新證據形態的主要分 支。 《關于辦理刑事案件收集提取和審查判斷電子數據若干問題的規定》隨即明確將電子數據界定為“案 件發生過程中形成的以數字化形式存儲、處理、傳輸 的能夠證明案件事實的數據”,并將“文檔、圖片、音視 頻、數字證書、計算機程序等電子文件”列為典型的電 子數據形式①。 《公安機關辦理刑事案件電子數據取證 規則(2019)》進一步勾勒了電子數據證據收集、提取、 檢查、實驗、檢驗、鑒定等全生命周期的規制體系。

  2.1 待證數據的特征分析

  第五輪信息技術革命場景下進入訴訟階段的數 據囊括了所有以二進制代碼形式存在的試圖經過取 證、舉證、質證和認證后能夠作為證據使用的信息內 容及其派生物。 大數據、物聯網、云計算等技術應用的迅速迭代使得當前司法實踐中充斥著多樣化的新型待證數據。 相應的證明能力(待證數據的適格性驗 證)和證明力(待證數據的證明效果驗證)的法庭采 信與人證、物證、書證等傳統證據形態差異較大。 如一般證據規則為了更好地審核證據材料的真實性和合法性,通常要求扣押物理載體,但云計算的廣域分 布式處理模式和一臺云服務器可能同時承載大量來 源迥異的數據庫的特質, 導致實踐中難以獲取云端數據的物理介質。 又如,大多數的傳統證據形態是完 整的有形物,待證數據卻往往是零散的無形物,不僅 難以形成完備合法的證據鏈, 甚至不易證明證據來 源的合法性。

  2.2 待證數據的采信模式

  信息時代中飛速增長的待證數據必須經過查證 屬實才能作為認定事實的依據。 我國立法部門不僅 對待證數據的來源、取證主體、收集方式、存儲和出 示等完整流程的合法性、 數據內容的真實性及其與 案件事實的關聯性等的法庭審查作出原則性規定, 還逐步建立了有關待證數據技術鑒定的多項國家標 準和行業標準。 尤其是評估判斷待證數據是否可以合理認定為證據真實和鏈條完整的難題, 除了少量可以經由原被告或控辯雙方都認可或是其他證據足以充分證明予以解決之外, 絕大多數需要法官依據 經驗和理性進行審查判斷或是行業專家進行高水平 技術鑒定,部分個案輔以證人證言為證據基礎。

  2.2.1 法官審查判斷

  雖然我國沒有明確認可西方國家普遍采用的自 由心證制度,卻積極應用在實踐之中。 傳統的錄音錄像證據曾在很長時間內被認定為可信度較高的證據形式,法官通常基于專業知識和審判經驗,依據公正 且準確的標準,自行判斷其證明力。 隨著數字化音視 頻的迅猛發展,個人無法直接讀取、需要借助特殊工 具轉換輸出的以二進制形式存儲的待證數據大幅增 加。 全生命周期涉及物理載體的可信性、收集方法的 合法性、輸出內容的真實性、相關人員的獨立性以及 流程的完整性等一系列技術性較強的關鍵因素,即 便經驗豐富的法官也會產生較大的質疑和困惑,難以直接依據經驗和理性完成采信審核。 然而,隨著千 行百業的數字化進程日益加快, 數據類證據材料在 認定案件事實中的價值愈加凸顯, 眾多場景下不宜 僅認定為輔助性參考資料。 因之,聘請具有學科權威 身份和相關認證資質的專家運用科學原理進行真實 性鑒定逐漸成為采信待證數據的重要前提。

  2.2.2 專家技術鑒定

  隨著計算機技術、 生物醫藥技術及其他各種專 精化技術發展, 復雜零散的數據涉及的專門性問題 難以確定和解決。 判斷數據內容是否被篡改或偽造 需要采用專業工具和技術方法進行獲取、識別、存 儲、傳輸和分析。 科學驗證的范圍甚至包括數據取證 主體、取證程序、取證標準、取證技術和取證工具等 強關聯要素。 這一任務惟有通過具備行業領先技術 能力的專家群體依據鑒真規則開展精準辨識, 方可 較為圓滿地完成。

  3 深度合成待證數據的風險評估

  數碼攝影誕生之初的圖像質量較差, 往往只能作為補充證人證言的說明證據。 直至高質量的視頻

  數據直接完整地記錄了案件事實, 方才充分展現出證據價值。 然而,數據量級擴大且合成技術日趨復雜 等大幅提升了識破偽造音視頻的難度。 具有專門知 識的特聘人員依據科學原理作出的結論性鑒定意見 能夠準確辨識待證數據真實性的假設處于風雨飄搖 之中。

  3.1 降低說明證據可靠性

  長期以來, 證人證言一般不會被視為個案場景 下獨立證明案件事實的實質證據, 而是作為幫助找 出案件真相的說明證據。 原因在于,個人對于物體或 事件的認知一般包括感知、理解、回憶和證明等四大要素。 人類的記憶并非自體封裝的音視頻重現系統。 記憶的提取和表達是一個從龐雜的記憶數據庫的各 子域拼湊出對應內容的過程。 證人不僅應當知悉需要作證的內容, 往往還需要通過傳聞或推測填補闕 值內的記憶巢白。 因之,記憶內容的準確性很容易受 到外部信息與內在心理的影響。 證人通常也會主動為記憶準確性附加警示助詞,如“我覺得”“我認為” “我不能肯定”等[9]。 如英國華威大學(University of Warwick)的研究團隊通過測試視頻重現與受試者之 間的記憶關系, 證實偽造視頻數據對于證人記憶的 強烈暗示性①。 由此,通過深度合成關涉案件的主要數據重塑現實體驗并向證人展示, 比傳統的文本偽 造或圖像偽造更具直觀性和沖擊力, 容易導致證人 因混淆實際記憶和視覺效果而在無意中提供虛假證 言[10]。 也就是說,一方在法庭庭審過程中提交的深度 偽造視頻鑲嵌的欺詐性數據內容有可能影響證人準 確回憶事實真相,嚴重妨礙司法公正。

  3.2 影響鑒真算法成效

  近年來, 基于復雜模型鑒識待證數據與運用合 并算法提升偽造數據可信度之間的“貓鼠游戲”愈演 愈烈。 持續迭代的生成對抗網絡編程技術致使深度 偽造數據方案能夠迅速更新鑒真算法抵御模塊,難 以形成能夠長期有效地應用到各行各業的可靠鑒真方法。 目前主流的深度合成數據檢測技術仍然依賴 基于偽造內容數據集對模型檢測器的差異化訓練和 基于生物信息不一致性對偽造內容數據的辨識,很 難妥善應對迅速提升的深度合成技術。 如紐約州立 大學奧爾巴尼分校 (University at Albany,State University of New York) 的研究團隊發現早期深度合成

  視頻技術的訓練數據庫中大多是原始的靜態圖像數 據,導致算法無法準確偽造生理特征,輸出的仿真制 品中虛擬數字人的眨眼頻率遠遠低于真實視頻,進 而開發出實驗準確率高達 95%的眨眼檢測方法②。 即 通過第一神經網絡掃描檢測是否包含人臉并自動定 位到眼部,進而將眼部截圖輸入第二網絡,再由第二 網絡通過特征提取、 序列學習和狀態預測等辨識是 否為真人眨眼,進而鑒別出偽造視頻。 然而,這一全新的深度數據合成檢測模塊僅在短時間內展現出較 好的驗證效果。 事實上,該項成果公布不久之后,研 究團隊就收到了大量能夠通過“眨眼測試”的匿名視 頻。 這些制作者迅速在數據訓練集中增加了大量閉 眼圖像數據,積極改良識別器算法,進而導致“眨眼 測試”完全失靈。

  3.3 引發漣漪式信任衰退

  信息時代中, 難以及時準確地完成深度合成待證數據的鑒真義務, 有可能引發整個社會范圍內的漣漪式信任衰退。 窄域而言,具有極強技術性的深度 偽造產品往往展現出難以識別的逼真度, 不僅加大司法部門對于有關案件真相的數據真實性的質疑, 當事人還有可能宣稱作為證據的數據是經過深度偽 造合成的虛擬內容,以達到混淆視聽之目的。 廣域而 言,普遍運用深度合成技術的大環境下,人們不敢輕 易地相信所見所聞,嚴重威脅社會信任機制。

  3.4 侵害個人合法權益

  深度合成待證數據的完整流程充斥著侵害個人隱私、尊嚴、平等、自由及其他合法的人身權和財產 權的風險[11]。 如原始數據的收集主體、收集方式和收 集對象均有可能侵害個人隱私。 又如,深度合成過程中對于訓練內容的特征提取可以分為自動提取和手動提取兩大分支。 能夠自主學習的數據自動提取模 型在設計中可能被有意或無意地嵌入歧視性或侮辱性規則, 手動進行分類器訓練的模型則一直受到操 作者主觀偏見或認知缺陷的影響, 嚴重威脅自然人 的尊嚴權、平等權和自由權。

  3.5 威脅國家安全體系

  深度合成技術負面應用的多個領域直接關聯國家安全體系。 對于政商名流、新聞事件、軍事領導及社會事務相關人員與場景數據的深度偽造, 存在著 不少待證情境下難以精準及時地進行辨識的難題, 已經成為影響政治安全、社會安全、國家安全的不穩 定因素。

  4 健全深度合成待證數據的辨識機制

  萬物互聯的背景下, 網絡信息技術普遍應用在 生產生活之中, 數據對于查明案件事實具有極其重要的價值。 有效避免錯誤肯定深度合成待證數據的 方法不是棄之不用,而是充分發揮多方力量、迅速建 立健全科學有效的辨識機制。

  4.1 嚴格遏止源頭違規

  從源頭上遏止深度合成待證數據是查清案件事 實、營建可信社會的根本措施。 既需要加強直接關聯 的政策法規建設, 亦需要強化對相關技術和數據的研究與持有機構、企業及從業群體的監督管理,減少數據深度合成的負面作用。 如國家網信辦發布的《網 絡音視頻信息服務管理規定》明確指出,2020 年 1 月 1 日起, 發布深度合成視頻前必須按照有關規定開展安全評估并以顯著方式標識“非真實”字樣,且不 得用于發布虛假新聞等場景, 并開始部署深度合成音視頻的鑒別技術體系與健全相應的辟謠機制。

  4.2 重塑專家鑒定模式

  深度合成待證數據不僅無法憑借肉眼辨別,甚至難以通過傳統方法加以鑒識。 盡管眾多科研機構、 頭部企業和司法鑒定部門正在積極開發各種深度合 成檢測工具, 但迄今為止整體上落后于數據偽造技術。 行業專家依據經驗和知識辨別重要的微小變化 的能力往往不足以識別高度仿真的深度偽造制品。 待證數據的真實性認定亟待重塑專家鑒定模式。 目前而言, 深度合成圖像數據檢測的關鍵在于組織能夠及時有效地挖掘定制化修改點的專家團 隊。 深度偽造音視頻與真實視頻的特征差異比對迫 切要求技術專家構建完善的深度神經網絡架構以便更好地提取不自然的元素特征, 并在具體場景中輔 以虹膜驗證、指紋驗證以及人工鑒偽等。

  4.3 加強環境經驗支持

  早在全球深度偽造危機爆發之初, 美國國防部 高級研究計劃局(Defense Advanced Research Project Agency)就開始探索如何建立一個能夠辨別圖像或視 頻可信度的自動評分系統[12]。 通過集中比對待檢圖 像數據或視頻數據在內容上與各種外部經驗數據的不一致之處 (如與太陽光照位置不對應的陰影影像數據),提升深度合成數據的檢驗準確性。 同時,有必 要授權一方在一些具體場景中有權要求舉行聽證 會, 迫使待證數據提供方提供能夠間接證明真實性 的重要環境信息。

  5 結語

  深度合成待證數據是對社會正義最后防線、廣 大居民人身和財產安全乃至國家和社會有序運轉的 巨大威脅。 相關證偽方案執行不暢有可能導致社會信任體系全面崩盤。 亟待從源頭到末端營建精準高 效的風險辨識與應對框架。 如不僅通過推廣區塊鏈認證簽名工具加強數據來源標注, 還有必要建立基于區塊鏈和智能合約的待證數據來源追溯機制,推 動智慧司法,助力數字經濟,支撐智能化社會建設。

  參考文獻:

  [1] Elizabeth Caldera.Reject the Evidence of Your Eyes and Ears.Deepfakes and the Law of Virtual Replicants[J].Seton Hall Law Review,2019(50):177.

  [2] Russell Spivak.Deepfakes:The Newest Way to Commit One of the Oldest Crimes[J].Georgetown Law & Technology Review,2019(3):332.

  [3] Jeff Ward.10 Things Judges Should Know About AI[R].Deepfakes Report Act of 2019,116th Congress,H.R.3600,2019.

  [4] Kevin Roose.How Come the Fake Videos,Too[N].New York Times,2018-05-04.

  [5] Janko Rocttgers.Reddit,Twitter Ban Deepfake Celebrity Porn Videos[EB/OL].[2018-02-07].

  [6] Jessica Ice.Defamatory Political Deepfakes and the First Amendment[J].Case Western Reserve Law Review,2019(70):427.

  [7] “她”來了! 全球首位 3D 版 AI 合成主播精彩亮相[EB/OL].[2020-05-20].

  [8] Douglas Harris.Deepfakes:False Pornography Is Here and the Law Cannot Protect You[J].Duke Law & Technology Review,2019(17):99.

  [9] Mark Bennett.Unspringing the Witness Memory and Demeanor Trap:What Every Judge and Juror Needs to Know About Cognitive Psychology and Witness Credibility[J].American University Law Review,2015(64):1331.

  [10] Richard Schmechel,Timothy Toole.Beyond the Ken? Testing Jurors’ Understanding of Eyewitness Reliability Evidence[J].Jurimetrics,2006(46):178.

  [11] Robert Chesney.Deep Fakes:A Looming Challenge for Privacy,Democracy,and National Security[J].California Law Review,2019(107):1753.

  [12] Matt Turek.Media Forensics[EB/OL].[2020-11-30].

期刊VIP網,您身邊的高端學術顧問

文章名稱: 深度合成待證數據的風險剖析與辨識機制

文章地址: http://www.kg120.com/mianfeiwx/58788.html

國際期刊論文 SCI/SSCI選題匹配!

選擇豐富服務快速通過率高一鍵快速領取私人專屬發表方案!

* 填寫需求信息,或選擇平臺現有SCI/SSCI選題(如下)。

主站蜘蛛池模板: 昌黎县| 红原县| 梁山县| 平凉市| 陇川县| 永仁县| 安庆市| 金门县| 荆州市| 新建县| 上林县| 盐山县| 隆昌县| 和林格尔县| 虎林市| 凌源市| 德保县| 忻城县| 皋兰县| 正镶白旗| 合江县| 百色市| 高安市| 临潭县| 囊谦县| 镇平县| 屯昌县| 五寨县| 山西省| 修文县| 巢湖市| 视频| 华蓥市| 兴隆县| 新巴尔虎左旗| 昌邑市| 前郭尔| 怀来县| 东丽区| 财经| 镇巴县|