📄 A Multi-Domain Feature Fusion Framework for Generalizable Deepfake Detection Across Different Generators

#多模态模型 #数据增强

7.4/10 | 创新 1.5/2 | 严谨 1/1.5 | 实验 1.5/1.5 | 清晰 1/1 | 影响 0.3/1.5 | 开源 0.8/1.5 | 复现 0.5/0.5 | 工程 0.8/1.5

👥 作者与机构

第一作者：Amna Amjid，单位：国家科学技术大学（NUST），巴基斯坦。通讯作者：Sana Qadir，单位：国家科学技术大学（NUST），巴基斯坦。其他作者：Mehwish Fatima（同NUST），Raja Khurram Shahzad（密德瑞典大学及吕勒奥理工大学）。

💡 毒舌点评

这篇论文的“多领域融合”听起来挺唬人，但实际上就是把RGB、梯度图和DWT小波系数三个东西拼接在一起，然后丢进一个现成的双路残差网络（DRN）里。这种“融合”缺乏任何新颖的交互或注意力机制，更像是工程上的简单叠加。论文最大的亮点是实验设置比较系统，把跨模型、跨范式、多源和真实世界测试都做了一遍，这值得肯定。但问题在于，所有实验结果都强烈暗示，在这个任务上，数据的多样性（多源训练）和标准的数据增强策略，比你那个“多领域特征融合”的设计本身贡献大得多。看看表VIII，用MIX_ALL加增强就从49%提到75.8%，而模型架构的改进从baseline DRN到SGFF-Net的提升幅度在跨模型测试中（表V）远没有这么明显。所以，这篇论文更像是一份详尽的深度伪造检测实验报告，而不是一个在方法论上有坚实贡献的工作。核心方法部分（III节）描述还算清晰，但理论深度几乎为零。最要命的是，摘要和结论中声称的“显著提升”需要更审慎地限定范围——在最具挑战性的真实世界泛化上，75.8%的准确率离实用还很远，而且这提升很大程度归功于训练数据策略，而非模型架构本身。

📌 核心摘要

针对现有深度伪造检测方法（尤其是基于空间或单一频率域的方法）在面对扩散模型生成内容时泛化能力不足的问题，本文提出SGFF-Net（空间-梯度-频率融合网络）。该框架在一个双路残差网络（DRN）架构中，并行提取并融合图像的RGB空间特征、基于预训练ResNet-50的梯度特征以及基于离散小波变换（DWT）的频率特征。论文通过系统性的消融研究确定了DWT（尤其是Symlet小波族和反射边界模式）作为最优的频率表示方法，并验证了三路特征融合的必要性。实验评估涵盖五个场景：数据集内评估、跨模型评估、跨范式评估、多源评估和真实世界评估。结果表明，SGFF-Net在数据集内评估中达到98.95%的准确率。然而，在最具挑战性的跨范式（如用扩散模型训练测试GAN数据）和真实世界测试中，其性能仍显著下降（跨范式约70%，真实世界最高75.8%）。关键发现是，引入多源训练和标准数据增强策略，比单纯改进模型架构对提升泛化能力（尤其是跨模型和真实世界场景）的贡献更为显著。

🔗 开源详情

代码：论文中声称代码在GitHub公开，但未提供具体仓库链接。
模型权重：论文中未提及。
数据集：论文中明确提到了三个公开数据集，其获取链接在论文中已给出：
1. DeepFakeFace (DFF): https://github.com/OpenRL-Lab/DeepFakeFace
2. Diffusion Face (DiffFace): https://github.com/Rapisurazurite/DiffFace
3. Diverse Fake Face Dataset (DFFD): https://cvlab.cse.msu.edu/dffd-dataset.html
Demo：论文中未提及。
复现材料：论文中提供了详细的训练配置参数（如使用PyTorch框架、AdamW优化器、学习率、批大小、训练轮次等），但未提及是否提供检查点、完整训练脚本或数据预处理/划分脚本。
论文中引用的开源项目：未提及除数据集外的其他第三方开源项目。

作者与机构

毒舌点评

核心摘要

方法概述和架构

SGFF-Net框架如图1所示，包含数据准备、预处理、特征提取和DRN检测四个主要阶段。

数据选择与结构化：研究使用了三个公开数据集：DeepFakeFace (DFF)， Diffusion Face (DiffFace) 和 Diverse Fake Face Dataset (DFFD)。这些数据集被划分为多个子集（如表III所示），以支持数据集内、跨模型（训练与测试使用同一范式下的不同生成器）、跨范式（训练与测试使用GAN和扩散这两种不同范式）、多源（混合训练）和真实世界（从互联网收集）等多种评估场景。
预处理：所有图像首先使用多任务级联卷积网络（MTCNN）进行人脸检测与裁剪，并统一缩放至 \(224 \times 224\) 像素。对于每张原始RGB图像 \(X\)，使用一个预训练（基于ResNet-50）的转换模型 \(G(\cdot)\) 计算其梯度图 \(X_g\)。具体而言，将图像 \(X_i\) 输入模型得到输出向量 \(z_i = G(X_i)\)，然后计算求和输出对输入的梯度：\(M_i = \frac{\partial \sum z_i}{\partial x_i}\)。该梯度图 \(M_i\) 反映了像素对真实/伪造分类的贡献强度。
特征提取器：该模块包含三个并行分支，用于从不同域提取特征：
- RGB（空间）分支：直接接收预处理后的RGB图像，通过两层卷积操作生成特征图 \(F_x\)。
- 梯度分支：接收生成的梯度图 \(X_g\)，同样通过两层卷积操作生成特征图 \(F_g\)。
- 频率分支：首先应用DWT对RGB图像的每个通道进行单层分解，得到LL、LH、HL、HH四个子带。通过消融实验（附录A），论文选择了将所有四个子带融合（LL+LH+HL+HH），并使用Symlet小波和反射边界模式。融合后的子带被重建成一个三通道的频率增强图像，再通过两层卷积处理生成特征图 \(F_r\)。最后，三个分支的特征图 \(F_x\), \(F_g\), \(F_r\) 在通道维度上进行拼接（Concatenation），形成大小为 \((192, 224, 224)\) 的融合特征图 \(F_{map}\)。
检测网络（DRN）：融合特征图 \(F_{map}\) 被输入一个双路残差网络（DRN）进行分类（如图3所示）。
- 初始编码：首先是一个 \(7 \times 7\)、步长为2的卷积层，将192通道特征降维至64通道，同时捕捉全局上下文信息。随后接实例-批归一化（IBN）和ReLU激活。
- 双路残差块：网络主体由一系列残差块构成。每个块内部包含局部路径（使用 \(1 \times 1\) 卷积捕捉细粒度跨域交互）和全局路径（使用堆叠的 \(3 \times 3\) 卷积捕捉空间相关性）。两条路径的输出与输入的残差连接相加，再经过ReLU激活。在初始层和残差块中使用了IBN归一化，以平衡风格一致性和内容特征。
- 分类头：经过全局平均池化将特征图压缩为256维向量，最后通过一个全连接层映射到2维输出（真实/伪造），使用softmax函数进行预测。
训练策略：使用AdamW优化器（初始学习率0.001，后降至0.0001），批大小32，训练30轮。损失函数为带标签平滑（0.05）的交叉熵损失。采用ReduceLROnPlateau学习率调度器。训练时应用多种数据增强（如JPEG压缩、随机缩放、旋转、翻转、色彩抖动、高斯噪声与模糊）。

核心创新点

多域特征融合框架：提出SGFF-Net，一个在DRN架构中并行集成RGB空间、梯度和DWT频率三路特征的端到端检测框架，旨在利用不同域的互补取证线索。
系统性的消融研究：通过详尽的消融实验（附录A）验证了关键设计选择，包括：DWT优于FFT/DCT；RGB输入优于灰度；Symlet小波和反射边界模式最优；融合所有DWT子带效果最佳；三路特征融合优于单路或双路组合。
全面的泛化评估：在五个递进难度的场景（数据集内、跨模型、跨范式、多源、真实世界）下评估框架性能，特别强调了跨范式和真实世界泛化的挑战，并量化了数据增强和多源训练策略的有效性。

实验结果

论文在所有评估场景中报告了准确率（Acc.）、精确率（Prec.）、召回率（Rec.）、F1分数、ROC-AUC和等错误率（EER）。主要结果如下表所示：

表IV: 数据集内评估

数据集	Acc.↑	Prec.↑	Rec.↑	F1↑	ROC-AUC↑	EER↓	Time(ms)↓
DFF_C	98.47	98.52	98.40	98.47	99.85	1.54	10.30
DFF_A	98.95	99.59	98.30	98.94	99.94	0.92	10.41
DFF_B	97.98	97.46	98.53	97.99	99.76	1.93	10.29
DFFD_A	98.89	98.99	98.80	98.89	99.94	1.04	10.41
MIX_ALL	97.83	93.66	98.10	95.84	99.32	3.53	10.50

表V: 跨模型评估

训练集	测试集	设置	Acc.↑	Prec.↑	Rec.↑	F1↑	ROC-AUC↑	EER↓
DFF_C	DiffFace (平均)	无增强	70.46	69.68	86.57	71.38	68.95	35.92
DFF_C	DiffFace (平均)	有增强	79.80	79.15	90.80	80.50	81.67	25.67
DFFD_A	DFFD_B	无增强	91.31	83.10	99.14	89.14	96.66	8.02
DFFD_A	DFFD_B	有增强	93.41	89.10	99.23	92.34	98.78	7.02

表VI: 跨范式评估（部分关键结果）

训练集	测试集	设置	Acc.↑	EER↓
DFF_C (扩散)	DFFD_A (GAN)	无增强	69.94	39.03
DFF_C (扩散)	DFFD_A (GAN)	有增强	78.12	24.15
DFFD_A (GAN)	DFF_C (扩散)	无增强	66.73	36.61
DFFD_A (GAN)	DFF_C (扩散)	有增强	76.98	23.61

表VIII: 真实世界评估

训练集	增强	Acc.↑	Prec.↑	Rec.↑	F1↑	ROC-AUC↑	EER↓
DFFD_A	否	45.00	43.90	36.00	39.56	42.96	45.05
DFF_C	否	49.00	47.47	75.00	58.14	48.47	51.00
MIX_ALL	否	61.50	60.59	62.00	63.29	61.92	41.00
MIX_ALL	是	75.80	70.80	85.00	73.08	77.86	31.00

细节详述

评分理由

创新性 (1.5/2)：问题定义清晰（跨生成器泛化），提出了一个融合三域特征的框架，且包含有价值的设计选择验证（消融实验）。然而，核心融合方法（拼接）和骨干网络（直接采用DRN）缺乏架构层面的创新，更多是系统性的集成与验证。
技术严谨性 (1.0/1.5)：实验设计系统，消融研究部分支撑了设计选择。但理论分析薄弱，例如未解释为何RGB+梯度+DWT的融合是充分的或最优的。对DRN架构的改动（融入IBN）描述较简略，其具体作用机制和优势分析不足。
实验充分性 (1.5/2.5)：实验设置非常全面，覆盖了从易到难的多个泛化场景，包括真实世界测试，这远超多数同类工作。消融实验也较为详尽。但缺少与当前最新SOTA方法的直接定量对比（尽管有相关工作讨论和表I定性总结），使得其相对性能提升不够明确。真实世界测试集规模较小（400张）。
清晰度 (1.3/1.5)：论文结构完整，图表清晰，方法描述基本清楚。但在一些关键细节上，如DWT子带融合的具体实现（是特征图相加还是通道拼接？）、DRN中局部路径和全局路径的详细结构等，描述可以更精确。
影响力 (0.3/0.5)：对数字媒体取证社区有实用价值，提出的评估范式和实验结论对后续工作有参考意义。但核心方法创新有限，且最终性能（特别是真实世界泛化）离实用仍有距离，限制了其影响力。
开源 (0.8/1.5)：论文声称开源代码并提供了数据集链接，有利于部分复现。但未提供代码仓库具体地址、模型权重、数据预处理/划分脚本，降低了可复现性。因此开源部分未完全兑现承诺。
可复现性 (0.8/1.5)：提供了关键超参数和训练细节，数据集公开。但由于缺少代码、预处理脚本和完整训练流程，他人要精确复现所有实验结果存在较大困难。
工程/实践价值 (0.8/1.0)：框架设计模块化，推理速度快（~10-14ms/图），适合考虑部署。实验表明数据增强和多源训练对实用性能至关重要，提供了有价值的工程实践经验。但75.8%的真实世界准确率仍显不足。

局限与问题

除了作者自述的局限，本文还存在以下问题：

创新性贡献的实质影响存疑：论文最大的性能提升（尤其在跨模型和真实世界场景）源于数据增强和多源训练，而非提出的特征融合架构。这引发一个问题：该架构改进的必要性有多大？如果仅用更强的数据策略配合一个简单CNN也能达到类似效果，则论文的核心创新价值会打折扣。
实验设计的潜在漏洞：
- 跨模型评估的“平均”操作：在表V中，跨模型评估（DFF_C -> DiffFace）是测试在多个子集上的平均性能。这可能会掩盖模型在某些特定生成器上表现极差的情况，而只展示一个乐观的平均值。
- 真实世界数据集的构成：从互联网收集的400张真实/伪造图片，其“AI生成”的部分可能包含大量已被现有检测器知晓的“伪造”类型（如早期GAN模型生成），未必能充分代表论文声称要应对的“最先进扩散模型”生成内容。这使得“真实世界”评估的难度和代表性存疑。
- 缺乏对失败案例的分析：论文未深入分析在跨范式或真实世界测试中，哪些类型的伪造图像导致了模型的主要失败，这对于理解方法的边界和改进方向至关重要。
结论部分过度泛化：论文在摘要和结论中声称“学习了互补的取证线索”、“显著提高了鲁棒性”。但实验显示，在最具挑战性的跨范式设置下，性能仍远低于数据集内性能，且“互补”的贡献未被严格解耦证明。更准确的结论应是：在本文实验条件下，多域融合结合强数据策略，在特定基准上取得了一定进步，但远未解决泛化问题。
方法部分描述可更深入：例如，梯度图的生成过程中，预训练的ResNet-50转换模型的训练细节（在什么数据集上训练？目标函数？）未充分说明，这影响了对梯度特征可靠性的判断。

开源详情

代码：论文声明代码公开于GitHub，但未给出具体仓库链接。
模型权重：未提及。
数据集：提供了三个所用公开数据集的明确链接。
Demo：未提及。
复现材料：提供了详细的超参数和训练配置（优化器、学习率、批大小、轮次、损失函数等）。
论文中引用的��源项目：未明确引用除数据集外的第三方开源项目。

🏗️ 方法概述和架构

SGFF-Net框架如图1所示，包含数据准备、预处理、特征提取和DRN检测四个主要阶段。

数据选择与结构化：研究使用了三个公开数据集：DeepFakeFace (DFF)， Diffusion Face (DiffFace) 和 Diverse Fake Face Dataset (DFFD)。这些数据集被划分为多个子集（如表III所示），以支持数据集内、跨模型（训练与测试使用同一范式下的不同生成器）、跨范式（训练与测试使用GAN和扩散这两种不同范式）、多源（混合训练）和真实世界（从互联网收集）等多种评估场景。
预处理：所有图像首先使用多任务级联卷积网络（MTCNN）进行人脸检测与裁剪，并统一缩放至 \(224 \times 224\) 像素。对于每张原始RGB图像 \(X\)，使用一个预训练（基于ResNet-50）的转换模型 \(G(\cdot)\) 计算其梯度图 \(X_g\)。具体而言，将图像 \(X_i\) 输入模型得到输出向量 \(z_i = G(X_i)\)，然后计算求和输出对输入的梯度：\(M_i = \frac{\partial \sum z_i}{\partial x_i}\)。该梯度图 \(M_i\) 反映了像素对真实/伪造分类的贡献强度。
特征提取器：该模块包含三个并行分支，用于从不同域提取特征：
- RGB（空间）分支：直接接收预处理后的RGB图像，通过两层卷积操作生成特征图 \(F_x\)。
- 梯度分支：接收生成的梯度图 \(X_g\)，同样通过两层卷积操作生成特征图 \(F_g\)。
- 频率分支：首先应用DWT对RGB图像的每个通道进行单层分解，得到LL、LH、HL、HH四个子带。通过消融实验（附录A），论文选择了将所有四个子带融合（LL+LH+HL+HH），并使用Symlet小波和反射边界模式。融合后的子带被重建成一个三通道的频率增强图像，再通过两层卷积处理生成特征图 \(F_r\)。最后，三个分支的特征图 \(F_x\), \(F_g\), \(F_r\) 在通道维度上进行拼接（Concatenation），形成大小为 \((192, 224, 224)\) 的融合特征图 \(F_{map}\)。
检测网络（DRN）：融合特征图 \(F_{map}\) 被输入一个双路残差网络（DRN）进行分类（如图3所示）。
- 初始编码：首先是一个 \(7 \times 7\)、步长为2的卷积层，将192通道特征降维至64通道，同时捕捉全局上下文信息。随后接实例-批归一化（IBN）和ReLU激活。
- 双路残差块：网络主体由一系列残差块构成。每个块内部包含局部路径（使用 \(1 \times 1\) 卷积捕捉细粒度跨域交互）和全局路径（使用堆叠的 \(3 \times 3\) 卷积捕捉空间相关性）。两条路径的输出与输入的残差连接相加，再经过ReLU激活。在初始层和残差块中使用了IBN归一化，以平衡风格一致性和内容特征。
- 分类头：经过全局平均池化将特征图压缩为256维向量，最后通过一个全连接层映射到2维输出（真实/伪造），使用softmax函数进行预测。
训练策略：使用AdamW优化器（初始学习率0.001，后降至0.0001），批大小32，训练30轮。损失函数为带标签平滑（0.05）的交叉熵损失。采用ReduceLROnPlateau学习率调度器。训练时应用多种数据增强（如JPEG压缩、随机缩放、旋转、翻转、色彩抖动、高斯噪声与模糊）。

💡 核心创新点

多域特征融合框架：提出SGFF-Net，一个在DRN架构中并行集成RGB空间、梯度和DWT频率三路特征的端到端检测框架，旨在利用不同域的互补取证线索。
系统性的消融研究：通过详尽的消融实验（附录A）验证了关键设计选择，包括：DWT优于FFT/DCT；RGB输入优于灰度；Symlet小波和反射边界模式最优；融合所有DWT子带效果最佳；三路特征融合优于单路或双路组合。
全面的泛化评估：在五个递进难度的场景（数据集内、跨模型、跨范式、多源、真实世界）下评估框架性能，特别强调了跨范式和真实世界泛化的挑战，并量化了数据增强和多源训练策略的有效性。

📊 实验结果

论文在所有评估场景中报告了准确率（Acc.）、精确率（Prec.）、召回率（Rec.）、F1分数、ROC-AUC和等错误率（EER）。主要结果如下表所示：

表IV: 数据集内评估

数据集	Acc.↑	Prec.↑	Rec.↑	F1↑	ROC-AUC↑	EER↓	Time(ms)↓
DFF_C	98.47	98.52	98.40	98.47	99.85	1.54	10.30
DFF_A	98.95	99.59	98.30	98.94	99.94	0.92	10.41
DFF_B	97.98	97.46	98.53	97.99	99.76	1.93	10.29
DFFD_A	98.89	98.99	98.80	98.89	99.94	1.04	10.41
MIX_ALL	97.83	93.66	98.10	95.84	99.32	3.53	10.50

表V: 跨模型评估

训练集	测试集	设置	Acc.↑	Prec.↑	Rec.↑	F1↑	ROC-AUC↑	EER↓
DFF_C	DiffFace (平均)	无增强	70.46	69.68	86.57	71.38	68.95	35.92
DFF_C	DiffFace (平均)	有增强	79.80	79.15	90.80	80.50	81.67	25.67
DFFD_A	DFFD_B	无增强	91.31	83.10	99.14	89.14	96.66	8.02
DFFD_A	DFFD_B	有增强	93.41	89.10	99.23	92.34	98.78	7.02

表VI: 跨范式评估（部分关键结果）

训练集	测试集	设置	Acc.↑	EER↓
DFF_C (扩散)	DFFD_A (GAN)	无增强	69.94	39.03
DFF_C (扩散)	DFFD_A (GAN)	有增强	78.12	24.15
DFFD_A (GAN)	DFF_C (扩散)	无增强	66.73	36.61
DFFD_A (GAN)	DFF_C (扩散)	有增强	76.98	23.61

表VIII: 真实世界评估

训练集	增强	Acc.↑	Prec.↑	Rec.↑	F1↑	ROC-AUC↑	EER↓
DFFD_A	否	45.00	43.90	36.00	39.56	42.96	45.05
DFF_C	否	49.00	47.47	75.00	58.14	48.47	51.00
MIX_ALL	否	61.50	60.59	62.00	63.29	61.92	41.00
MIX_ALL	是	75.80	70.80	85.00	73.08	77.86	31.00

⚖️ 评分理由

创新性 (1.5/2)：问题定义清晰（跨生成器泛化），提出了一个融合三域特征的框架，且包含有价值的设计选择验证（消融实验）。然而，核心融合方法（拼接）和骨干网络（直接采用DRN）缺乏架构层面的创新，更多是系统性的集成与验证。
技术严谨性 (1.0/1.5)：实验设计系统，消融研究部分支撑了设计选择。但理论分析薄弱，例如未解释为何RGB+梯度+DWT的融合是充分的或最优的。对DRN架构的改动（融入IBN）描述较简略，其具体作用机制和优势分析不足。
实验充分性 (1.5/2.5)：实验设置非常全面，覆盖了从易到难的多个泛化场景，包括真实世界测试，这远超多数同类工作。消融实验也较为详尽。但缺少与当前最新SOTA方法的直接定量对比（尽管有相关工作讨论和表I定性总结），使得其相对性能提升不够明确。真实世界测试集规模较小（400张）。
清晰度 (1.3/1.5)：论文结构完整，图表清晰，方法描述基本清楚。但在一些关键细节上，如DWT子带融合的具体实现（是特征图相加还是通道拼接？）、DRN中局部路径和全局路径的详细结构等，描述可以更精确。
影响力 (0.3/0.5)：对数字媒体取证社区有实用价值，提出的评估范式和实验结论对后续工作有参考意义。但核心方法创新有限，且最终性能（特别是真实世界泛化）离实用仍有距离，限制了其影响力。
开源 (0.8/1.5)：论文声称开源代码并提供了数据集链接，有利于部分复现。但未提供代码仓库具体地址、模型权重、数据预处理/划分脚本，降低了可复现性。因此开源部分未完全兑现承诺。
可复现性 (0.8/1.5)：提供了关键超参数和训练细节，数据集公开。但由于缺少代码、预处理脚本和完整训练流程，他人要精确复现所有实验结果存在较大困难。
工程/实践价值 (0.8/1.0)：框架设计模块化，推理速度快（~10-14ms/图），适合考虑部署。实验表明数据增强和多源训练对实用性能至关重要，提供了有价值的工程实践经验。但75.8%的真实世界准确率仍显不足。

🚨 局限与问题

除了作者自述的局限，本文还存在以下问题：

创新性贡献的实质影响存疑：论文最大的性能提升（尤其在跨模型和真实世界场景）源于数据增强和多源训练，而非提出的特征融合架构。这引发一个问题：该架构改进的必要性有多大？如果仅用更强的数据策略配合一个简单CNN也能达到类似效果，则论文的核心创新价值会打折扣。
实验设计的潜在漏洞：
- 跨模型评估的“平均”操作：在表V中，跨模型评估（DFF_C -> DiffFace）是测试在多个子集上的平均性能。这可能会掩盖模型在某些特定生成器上表现极差的情况，而只展示一个乐观的平均值。
- 真实世界数据集的构成：从互联网收集的400张真实/伪造图片，其“AI生成”的部分可能包含大量已被现有检测器知晓的“伪造”类型（如早期GAN模型生成），未必能充分代表论文声称要应对的“最先进扩散模型”生成内容。这使得“真实世界”评估的难度和代表性存疑。
- 缺乏对失败案例的分析：论文未深入分析在跨范式或真实世界测试中，哪些类型的伪造图像导致了模型的主要失败，这对于理解方法的边界和改进方向至关重要。
结论部分过度泛化：论文在摘要和结论中声称“学习了互补的取证线索”、“显著提高了鲁棒性”。但实验显示，在最具挑战性的跨范式设置下，性能仍远低于数据集内性能，且“互补”的贡献未被严格解耦证明。更准确的结论应是：在本文实验条件下，多域融合结合强数据策略，在特定基准上取得了一定进步，但远未解决泛化问题。
方法部分描述可更深入：例如，梯度图的生成过程中，预训练的ResNet-50转换模型的训练细节（在什么数据集上训练？目标函数？）未充分说明，这影响了对梯度特征可靠性的判断。

📷 论文图片

← 返回 2026-06-15 语音/音乐/音频论文速递

📄 A Multi-Domain Feature Fusion Framework for Generalizable Deepfake Detection Across Different Generators#

👥 作者与机构#

💡 毒舌点评#

📌 核心摘要#

🔗 开源详情#

标签#

作者与机构#

毒舌点评#

核心摘要#

方法概述和架构#

核心创新点#

实验结果#

细节详述#

评分理由#

局限与问题#

开源详情#

🏗️ 方法概述和架构#

💡 核心创新点#

📊 实验结果#

⚖️ 评分理由#

🚨 局限与问题#

📷 论文图片#

📎 相关论文