Localizing Speech Deepfakes Beyond Transitions via Segment-Aware Learning
📄 Localizing Speech Deepfakes Beyond Transitions via Segment-Aware Learning #音频深度伪造检测 #数据增强 #自监督学习 #语音安全 #鲁棒性 🔥 8.0/10 | 前25% | #音频深度伪造检测 | #数据增强 | #自监督学习 #语音安全 学术质量 7.5/7 | 选题价值 0.5/2 | 复现加成 0.0 | 置信度 高 👥 作者与机构 第一作者:Yuchen Mao 通讯作者:Yanmin Qian 作者列表:Yuchen Mao (Auditory Cognition and Computational Acoustics Lab, MoE Key Lab of Artificial Intelligence, AI Institute, School of Computer Science, Shanghai Jiao Tong University), Wen Huang (同Yuchen Mao的单位), Yanmin Qian (上海交通大学计算机科学学院 听觉认知与��算声学实验室,教育部人工智能重点实验室,AI学院; VUI Labs) 💡 毒舌点评 亮点:论文精准地指出了现有方法过度依赖“过渡区域伪影”的“捷径学习”短板,并提出了简洁有效的“段感知学习”框架,通过位置监督和跨段混合,强制模型理解伪造内容本身,显著提升了在最具挑战性的“中间段”的检测能力和跨数据集泛化性能。短板:尽管实验充分,但对模型容量(如Conformer块的具体参数)、训练硬件和时长的描述不够详尽,且未公开模型权重,这为学术界和工业界的复现与直接应用设置了一定门槛。 ...