Disentangling Speaker and Language Effects in Cross-Lingual Speaker Verification for Iberian Languages
📄 Disentangling Speaker and Language Effects in Cross-Lingual Speaker Verification for Iberian Languages #说话人验证 #迁移学习 #自监督学习 #多语言 #数据集 5.6/10 | 创新 1.1/2 | 严谨 0.9/1.5 | 实验 0.7/1.5 | 清晰 0.6/1 | 影响 0.7/1.5 | 开源 1/1.5 | 复现 0.3/0.5 | 工程 0.3/1.5 📝 5.6/10 | 前50% | #说话人验证 | #迁移学习 | #自监督学习 #多语言 | arxiv 👥 作者与机构 第一作者:Pol Buitrago(Barcelona Supercomputing Center, Universitat Politècnica de Catalunya) 通讯作者:Pol Buitrago(Barcelona Supercomputing Center, Universitat Politècnica de Catalunya) 作者列表:Pol Buitrago(Barcelona Supercomputing Center, Universitat Politècnica de Catalunya)、Javier Hernando(Universitat Politècnica de Catalunya) 💡 毒舌点评 本文尝试用一套漂亮的同说话人双语评测集来解耦跨语言 SV 中的语言与说话人混淆效应,研究动机清晰且评测设计确有巧思。然而全文仅围着 mHuBERT-147 一个模型打转,连 ECAPA-TDNN 或 WavLM 的影子都没见着,结论的普适性几乎无从谈起;西班牙语-加利西亚语同说话人评测集仅 21 人,却据此得出"语言效应仍占主导"这样的大结论,说服力堪忧。更让人捏把汗的是,CLTM 定义中训练/测试说话人身份的具体关系始终含混不清,而这么关键的变量一旦控制不好,因果推断怕是站不住脚。 ...