AudioTrust: Benchmarking The Multifaceted Trustworthiness of Audio Large Language Models
📄 AudioTrust: Benchmarking The Multifaceted Trustworthiness of Audio Large Language Models #基准测试 #模型评估 #音频大模型 #鲁棒性 ✅ 7.5/10 | 前25% | #基准测试 | #基准测试 | #模型评估 #音频大模型 学术质量 5.5/7 | 选题价值 2.0/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Kai Li(论文中标注为共同第一作者,其机构为清华大学计算机系) 通讯作者:Xinfeng Li(论文中标注为†,其机构为南洋理工大学) 作者列表: Kai Li(清华大学计算机系, Institute for AI, BNRist) Can Shen(北京师范大学-香港浸会大学联合国际学院,BNBU) Yile Liu(早稻田大学,Waseda University) Jirui Han(独立研究者) Kelong Zheng(华中科技大学,HUST) Xuechao Zou(北京交通大学,BJTU) Lionel Z. Wang(未说明具体机构,作者列表归属南洋理工大学) Shun Zhang(清华大学) Xingjian Du(罗切斯特大学) Hanjun Luo(浙江大学) Yingbin Jin(香港理工大学) Xinxin Xing(独立研究者) Ziyang Ma(上海交通大学,及12号单位) Yue Liu(新加坡国立大学) Yifan Zhang(中国科学院,CAS) Junfeng Fang(新加坡国立大学) Kun Wang(南洋理工大学) Yibo Yan(香港科技大学(广州)) Gelei Deng(南洋理工大学) Haoyang Li(香港理工大学) Yiming Li(南洋理工大学) Xiaobin Zhuang(字节跳动) Tianlong Chen(北卡罗来纳大学教堂山分校) Qingsong Wen(松鼠AI学习) Tianwei Zhang(南洋理工大学) Yang Liu(南洋理工大学) Haibo Hu(香港理工大学) Zhizheng Wu(香港中文大学(深圳)) Xiaolin Hu(清华大学计算机系, Institute for AI, BNRist) Eng-Siong Chng(南洋理工大学) Wenyuan Xu(浙江大学) XiaoFeng Wang(南洋理工大学) Wei Dong(南洋理工大学) Xinfeng Li(南洋理工大学) 💡 毒舌点评 本文最大的亮点在于其雄心和系统性:它是第一个为ALLM量身定做可信度评估框架的工作,直指音频模态引入的“非语义”攻击面,如情绪操纵、口音偏见和环境声伪造,这比单纯评估文本安全要深刻得多。然而,其短板也相当明显:作为一个“评估”工作,它严重依赖GPT-4o和Qwen3作为评估器,这本质上是用一个黑箱模型去评判另一个黑箱模型的可信度,其评估结果本身的“可信度”值得打个问号;此外,部分实验(如隐私推断)的自动化评估结果与常识或直觉可能存在偏差(如论文所示,所有模型在隐私推断上几乎全部失败),需要更深入的人类评估来验证。 ...