Verifiable Provenance and Watermarking for Generative AI: An Evidentiary Framework for International Operational Law and Domestic Courts

📄 Verifiable Provenance and Watermarking for Generative AI: An Evidentiary Framework for International Operational Law and Domestic Courts #多媒体取证 #合成媒体与深度伪造检测 #数字水印与数据隐藏 #认证与出处 #证据法 #国际人道法 #人工智能法规 🔥 8.6/10 | 前25% | #多媒体取证 | #合成媒体与深度伪造检测 | #数字水印与数据隐藏 #认证与出处 | arxiv 学术质量 6.5/7 | 影响力 0.5/2 | 可复现性 1.6/2 👥 作者与机构 Gustav Olaf Yunus Laitinen-Fredriksson Lundström-Imanov (通讯作者): 瑞典国防大学军事研究系,斯德哥尔摩。邮箱: olal0604@student.fhs.se; ORCID: 0009-0006-5184-0810。 Nurana Abdullayeva: ADA大学法学院,巴库,阿塞拜疆。邮箱: nabdullayeva20516@ada.edu.az。 论文注明作者未获得外部资助,且无利益冲突。 💡 毒舌点评 这是一篇典型的“法律-技术交叉”论文,野心勃勃地试图用一套技术框架统一三个风马牛不相及的法律体系的证据标准。技术部分(Dempster-Shafer聚合)本身并不新颖,真正的“卖点”是那套详尽的法律分析、阈值建议和模型附件(比如附录E的作战规则附录)。对于纯技术读者而言,可能会觉得“就这?”——因为核心的检测结果(Table II)显示,面对Tier 4攻击,最好的组合方案TPR也只有0.413。论文的价值更多体现在其系统性的跨学科映射和提供的实用工具(如Jury Instruction模板),而非推动检测技术本身的边界。另外,所有“代码和数据”都需向作者请求,这在大谈“可复现性”的同时略显讽刺。 📌 核心摘要 问题:生成式AI内容真实性验证需要满足三个不同法律体系(国际作战法、国内诉讼、产品法规)的证明要求,目前缺乏统一框架。 方法:构建统一证据对象元组 π=(σ, ω, ζ, λ) ,通过Dempster-Shafer聚合器(公式2)将加密出处(σ)、水印检测(ω)、零知识证明(ζ)及洗涤描述符(λ)组合为单一充分性得分 ℒ_R(π)。针对每个法律体系R,设定不同的法律阈值 τ_R(如作战法中,人口稠密区动能行动要求后验概率P(H|E)≥0.95)。 威胁模型:定义从Tier 1(简单再生成)到Tier 5(内部人士伪造出处)的五级对手能力阶梯。 实验:在包含图像、音频、视频各4,000项(经6种洗涤管道,共72,000样本)的基准上评估四种方案(C2PA Ed25519、Stable Signature、Tree Ring Watermark、Gaussian Shading)。核心发现是任何单一方案均不足,组合方案在Tier 2/3攻击下对部分阈值满足要求,在Tier 4下表现仍有限(见Table II, V)。 贡献:提出映射框架、发布基准、提供法律阈值建议及可操作的模型附件(规则、陪审团指示、披露模板)。 🔗 开源详情 代码:论文声明整个流程(包括生成种子、清洗参数、真值标签、评估脚本和统计引导程序)均公开,作为补充材料发布,但未提供具体的代码仓库URL(如GitHub、GitLab链接)。 模型权重:论文未提出新的模型权重。评估使用了现有方案的公开参考检查点(如Stable Signature的48位公开检查点、Tree Ring Watermark的默认配置等),但未提供这些预训练权重的具体下载链接。生成样本所用的生成模型(如SDXL, FLUX.1等)的检查点也被声明为公开可用,同样未提供具体链接。 数据集:论文描述了一个包含12,000个生成项目(图像、音频、视频各4,000个)和72,000个评估样本的基准数据集。数据集采用Creative Commons Attribution 4.0 International许可证。数据集的获取方式为“可向通讯作者提出合理请求”,论文中未提供公开的直接下载URL(如HuggingFace或GitHub链接)。同行评审期间可通过编辑部获取匿名快照。 Demo:论文未提及在线演示链接。 复现材料:论文明确声明提供了完整的复现材料,包括:生成种子、清洗参数、真值标签、评估脚本、统计引导程序、容器镜像规范以及参考实现的验证器。这些将作为本文的补充材料发布。论文中未提供这些复现材料的具体下载链接。 论文中引用的开源项目: C2PA (Coalition for Content Provenance and Authenticity):论文引用了其开放规范。官方规范主页:https://c2pa.org/ c2pa-rs:论文在实现细节中提及使用了版本为0.32的参考实现。这是一个用于处理C2PA标准的Rust库,其开源仓库为:https://github.com/contentauth/c2pa-rs arkworks:论文在实现细节中提及使用了版本为0.4的库,用于zk-SNARK后端。这是一个用于构建零知识证明的Rust生态系统,其官网为:https://arkworks.rs/ Stable Signature:论文评估了此水印方案,其原文引用为[6]。这是一个基于稳定扩散的解码器水印方案,论文未提供其具体代码链接,但指出了其使用公开的48位检查点。 Tree Ring Watermark:论文评估了此水印方案,其原文引用为[7]。这是一个基于初始噪声张量的环形水印方案,论文未提供其具体代码链接。 Gaussian Shading:论文评估了此水印方案,其原文引用为[8]。这是一个基于约束高斯区域的统计校准水印方案,论文未提供其具体代码链接。 Zhao et al. 攻击:论文引用了其关于水印移除的攻击(扩散净化)[11],未提供具体代码链接。 Saberi et al. 攻击:论文引用了其关于水印移除的攻击(再生攻击)[12],并提到了其公开的参考实现,但未提供具体链接。 An et al. WAVES:论文在对比中提到了此工作[13],其包含压力测试基准,未提供具体代码链接。 🏗️ 方法概述和架构 本文提出一个统一证据框架,核心是构建一个可聚合多种验证源的“证明对象”,并将其输出映射到不同法律体系的充分性阈值上。 ...

2026-05-21 · 更新于 2026-06-12 · 3 min · 498 words

语音/音乐/音频论文速递 2026-05-21

语音/音乐/音频论文速递 2026-05-21 共分析 40 篇论文 ⚡ 今日概览 📥 抓取 40 篇 → 🔬 深度分析完成 🏷️ 热门方向 方向 数量 分布 #语音识别 4篇 ████ #音乐生成 3篇 ███ #语音对话系统 3篇 ███ #语音分离 2篇 ██ #语音质量评估 2篇 ██ #语音合成 1篇 █ #盲源分离 1篇 █ #声场重建 1篇 █ 📊 论文评分排行榜(40 篇,按分数降序) 排名 论文 评分 分档 主任务 🥇 Raon-OpenTTS: Open Models and Data for Robust Text-to-S 9.5分 前25% #语音合成 🥈 Mega-ASR: Towards In-the-wild^2 Speech Recognition via 9.3分 前25% #语音识别 🥉 Cross-Talk Speech Reduction, by Separation, for Separat 9.1分 前25% #语音分离 4. Normative Networks for Source Separation via Local Plas 8.9分 前25% #盲源分离 5. Causal Spatio-Temporal Sound Field Reconstruction 8.7分 前25% #声场重建 6. CounterFlow: A Two-Phase Inference-Time Sampling for Co 8.7分 前50% #音频生成 7. Verifiable Provenance and Watermarking for Generative A 8.6分 前25% #多媒体取证 8. CoarseSoundNet: Building a reliable model for ecologica 8.5分 前25% #音频分类 9. Executable Boundary Contracts for Sound Event Traces 8.5分 前25% #音频事件检测 10. Instrumental Text-to-Music Generation with Auxiliary Co 8.4分 前25% #音乐生成 11. Codec-Robust Attacks on Audio LLMs 8.3分 前25% #音频安全 12. SCRIBE: Diagnostic Evaluation and Rich Transcription Mo 8.3分 前25% #语音识别 13. Evaluating Speech Articulation Synthesis with Articulat 8.2分 前25% #语音质量评估 14. FormalASR: End-to-End Spoken Chinese to Formal Text 8.2分 前25% #语音识别 15. SEABAD: A Tropical Bird Activity Detection Dataset for 8.1分 前50% #生物声学 #音频事件检测 16. MSAVBench: Towards Comprehensive and Reliable Evaluatio 8.1分 前25% #基准测试 17. DuplexSLA: A Full-Duplex Spoken Language Model with Syn 7.8分 前25% #语音对话系统 18. A Survey of Audio Reasoning in Multimodal Foundation Mo 7.7分 前50% #音频推理 19. Stage-adaptive Token Selection for Efficient Omni-modal 7.7分 前25% #多模态模型 20. Synchronization and Turn-Taking in Full-Duplex Speech D 7.6分 前25% #语音对话系统 21. Fast Multichannel NMF with Block-Diagonal Spatial Covar 7.5分 前50% #语音分离 22. PlanRAG-Audio: Planning and Retrieval Augmented Generat 7.4分 前50% #长音频理解 23. DASM: Domain-Aware Sharpness Minimization for Multi-Dom 7.4分 前25% #音频隐写分析 24. Linearly Constrained Deep Beamformer for Multi-Speaker 7.3分 前25% #语音增强 25. From Numbers to Perception, Energy Decay Curves Predict 7.2分 前50% #空间音频 26. A strongly annotated passive acoustic dataset for tropi 7.2分 前50% #生物声学 27. Heterogeneity-Aware Dataset Scheduling for Efficient Au 7.0分 前25% #音频问答 28. Thinking-while-speaking: A Controlled, Interleaved Reas 6.9分 前50% #语音对话系统 29. Precise and Simple Audio-to-Score Alignment 6.8分 前50% #音乐信息检索 30. Benchmarking Commercial ASR Systems on Code-Switching S 6.8分 前50% #语音识别 31. CRAFT: Critic-Refined Adaptive Key-Frame Targeting for 6.6分 前50% #多模态问答 32. Optimising Neural Speech Codecs for 300bps Communicatio 6.5分 前50% #音频编码 33. A Survey of Large Audio Language Models: Generalization 6.2分 前50% #音频大模型 34. Speech Quality Embeddings for Improved Detection and Cl 5.8分 前50% #语音质量评估 35. Musical Attention Transformer: Music Generation Using a 5.6分 前50% #音乐生成 36. Music of Changing Lines: Toward a Culturally Situated A 5.5分 前50% #音乐生成 37. π-Bench: Evaluating Proactive Personal Assistant Agents 5.2分 后50% #长期助手 38. Ordering Matters: Rank-Aware Selective Fusion for Blend 5.0分 后50% #多模态情感识别 39. FlowLong: Inference-time Long Video Generation via Mani 4.9分 前50% #视频生成 40. A conceptual framework for learning to listen by reward 4.0分 后50% #声源定位 📋 论文列表 🥇 Raon-OpenTTS: Open Models and Data for Robust Text-to-Speech 🔥 9.5/10 | 前25% | #语音合成 | #扩散模型 | #数据集 #基准测试 | arxiv ...

2026-05-21 · 更新于 2026-06-12 · 26 min · 5389 words