公平性研究

📄 Evaluating Bias in Spoken Dialogue LLMs for Real-World Decisions and Recommendations #模型评估 #公平性研究 #语音大模型 #基准测试 #数据集 ✅ 7.0/10 | 前25% | #模型评估 | #公平性研究 | #语音大模型 #基准测试学术质量 5.0/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度中 👥 作者与机构第一作者：Yihao Wu (南洋理工大学) 通讯作者：Ziyang Ma (Soul AI Lab) 作者列表：Yihao Wu (南洋理工大学), Tianrui Wang (南洋理工大学), Yizhou Peng (南洋理工大学), Yi-Wen Chao (南洋理工大学), Xuyi Zhuang (南洋理工大学), Xinsheng Wang (Soul AI Lab), Shunshun Yin (Soul AI Lab), Ziyang Ma (Soul AI Lab) 💡 毒舌点评亮点：论文开创性地将多轮对话中“偏见持久性”作为评估维度，揭示了单轮测试可能掩盖的公平性问题，这比静态评估更贴近真实交互场景。短板：研究主要停留在“测量”现象阶段，对于“为何”不同模型或不同属性会产生差异性偏见缺乏深层次的机制探讨，也未能提出任何有效的偏见缓解策略，使得工作的闭环性不足。 ...