Verifiable Provenance and Watermarking for Generative AI: An Evidentiary Framework for International Operational Law and Domestic Courts
📄 Verifiable Provenance and Watermarking for Generative AI: An Evidentiary Framework for International Operational Law and Domestic Courts #多媒体取证 #合成媒体与深度伪造检测 #数字水印与数据隐藏 #认证与出处 #证据法 #国际人道法 #人工智能法规 🔥 8.6/10 | 前25% | #多媒体取证 | #合成媒体与深度伪造检测 | #数字水印与数据隐藏 #认证与出处 | arxiv 学术质量 6.5/7 | 影响力 0.5/2 | 可复现性 1.6/2 👥 作者与机构 Gustav Olaf Yunus Laitinen-Fredriksson Lundström-Imanov (通讯作者): 瑞典国防大学军事研究系,斯德哥尔摩。邮箱: olal0604@student.fhs.se; ORCID: 0009-0006-5184-0810。 Nurana Abdullayeva: ADA大学法学院,巴库,阿塞拜疆。邮箱: nabdullayeva20516@ada.edu.az。 论文注明作者未获得外部资助,且无利益冲突。 💡 毒舌点评 这是一篇典型的“法律-技术交叉”论文,野心勃勃地试图用一套技术框架统一三个风马牛不相及的法律体系的证据标准。技术部分(Dempster-Shafer聚合)本身并不新颖,真正的“卖点”是那套详尽的法律分析、阈值建议和模型附件(比如附录E的作战规则附录)。对于纯技术读者而言,可能会觉得“就这?”——因为核心的检测结果(Table II)显示,面对Tier 4攻击,最好的组合方案TPR也只有0.413。论文的价值更多体现在其系统性的跨学科映射和提供的实用工具(如Jury Instruction模板),而非推动检测技术本身的边界。另外,所有“代码和数据”都需向作者请求,这在大谈“可复现性”的同时略显讽刺。 📌 核心摘要 问题:生成式AI内容真实性验证需要满足三个不同法律体系(国际作战法、国内诉讼、产品法规)的证明要求,目前缺乏统一框架。 方法:构建统一证据对象元组 π=(σ, ω, ζ, λ) ,通过Dempster-Shafer聚合器(公式2)将加密出处(σ)、水印检测(ω)、零知识证明(ζ)及洗涤描述符(λ)组合为单一充分性得分 ℒ_R(π)。针对每个法律体系R,设定不同的法律阈值 τ_R(如作战法中,人口稠密区动能行动要求后验概率P(H|E)≥0.95)。 威胁模型:定义从Tier 1(简单再生成)到Tier 5(内部人士伪造出处)的五级对手能力阶梯。 实验:在包含图像、音频、视频各4,000项(经6种洗涤管道,共72,000样本)的基准上评估四种方案(C2PA Ed25519、Stable Signature、Tree Ring Watermark、Gaussian Shading)。核心发现是任何单一方案均不足,组合方案在Tier 2/3攻击下对部分阈值满足要求,在Tier 4下表现仍有限(见Table II, V)。 贡献:提出映射框架、发布基准、提供法律阈值建议及可操作的模型附件(规则、陪审团指示、披露模板)。 🔗 开源详情 代码:论文声明整个流程(包括生成种子、清洗参数、真值标签、评估脚本和统计引导程序)均公开,作为补充材料发布,但未提供具体的代码仓库URL(如GitHub、GitLab链接)。 模型权重:论文未提出新的模型权重。评估使用了现有方案的公开参考检查点(如Stable Signature的48位公开检查点、Tree Ring Watermark的默认配置等),但未提供这些预训练权重的具体下载链接。生成样本所用的生成模型(如SDXL, FLUX.1等)的检查点也被声明为公开可用,同样未提供具体链接。 数据集:论文描述了一个包含12,000个生成项目(图像、音频、视频各4,000个)和72,000个评估样本的基准数据集。数据集采用Creative Commons Attribution 4.0 International许可证。数据集的获取方式为“可向通讯作者提出合理请求”,论文中未提供公开的直接下载URL(如HuggingFace或GitHub链接)。同行评审期间可通过编辑部获取匿名快照。 Demo:论文未提及在线演示链接。 复现材料:论文明确声明提供了完整的复现材料,包括:生成种子、清洗参数、真值标签、评估脚本、统计引导程序、容器镜像规范以及参考实现的验证器。这些将作为本文的补充材料发布。论文中未提供这些复现材料的具体下载链接。 论文中引用的开源项目: C2PA (Coalition for Content Provenance and Authenticity):论文引用了其开放规范。官方规范主页:https://c2pa.org/ c2pa-rs:论文在实现细节中提及使用了版本为0.32的参考实现。这是一个用于处理C2PA标准的Rust库,其开源仓库为:https://github.com/contentauth/c2pa-rs arkworks:论文在实现细节中提及使用了版本为0.4的库,用于zk-SNARK后端。这是一个用于构建零知识证明的Rust生态系统,其官网为:https://arkworks.rs/ Stable Signature:论文评估了此水印方案,其原文引用为[6]。这是一个基于稳定扩散的解码器水印方案,论文未提供其具体代码链接,但指出了其使用公开的48位检查点。 Tree Ring Watermark:论文评估了此水印方案,其原文引用为[7]。这是一个基于初始噪声张量的环形水印方案,论文未提供其具体代码链接。 Gaussian Shading:论文评估了此水印方案,其原文引用为[8]。这是一个基于约束高斯区域的统计校准水印方案,论文未提供其具体代码链接。 Zhao et al. 攻击:论文引用了其关于水印移除的攻击(扩散净化)[11],未提供具体代码链接。 Saberi et al. 攻击:论文引用了其关于水印移除的攻击(再生攻击)[12],并提到了其公开的参考实现,但未提供具体链接。 An et al. WAVES:论文在对比中提到了此工作[13],其包含压力测试基准,未提供具体代码链接。 🏗️ 方法概述和架构 本文提出一个统一证据框架,核心是构建一个可聚合多种验证源的“证明对象”,并将其输出映射到不同法律体系的充分性阈值上。 ...