商业本质是增长,2012~2019年,移动互联网时代字节跳动通过渐进式创新实现主业快速增长,在夯实主业同时通过外延等方 式切入新赛道助力后续业务新增长...
2025-03-18 78 TMT行业报告
简言之,我们注意到 SGAN 在假样本被判定为真实的概率上升的同时,真样本被判定为真 实的概率并不会下降。事实上,正如广义 GAN 定义的第 3 点所提到的,所有非相对生成 对抗网络的𝑔̃1都无关紧要,因此都存在类似问题。不失一般性地,我们以 SGAN 为例, 从以下三方面论证“真样本被判定为真实的概率下降”的重要性。 1. SGAN 的判别器不具备“输入样本一半为假”的先验知识。 2. SGAN 的训练轨迹不能直接最小化 JS 散度。 3. 真样本对 SGAN 判别器梯度的影响随着训练的进行越来越小,判别器的学习趋于停滞。 判别器的先验知识 假设我们不考虑生成器无法影响真样本判别结果,在生成器训练阶段仍然向判别器输入真 样本。那么无论在判别器还是生成器训练阶段,判别器的输入均是一半真样本,一半假样 本。因此,判别器理应具备“输入样本一半为假”这一先验知识。
然而,在 SGAN 生成器训练结束阶段,理想状态下生成器生成的样本能够“蒙骗”判别器, 因此判别器会把所有样本都判定为真。这显然违背了“输入样本一半为假”的先验知识。 这意味着在 SGAN 中,除非我们刻意增加判别器训练的难度(例如降低学习速率、正则化), 否则判别器不会做出合理的判定。 如果时刻要求判别器具备这一先验知识,自然的想法是让判别器在真假样本之间进行取舍, 选取相对而言更真实的一半判定为真。为实现这种取舍,我们需要能够在生成器训练阶段 降低真样本被判定为真实的概率。进一步地说,理想状态下当生成器越来越强时,生成器 应能生成非常接近真实甚至更真实的数据。此时,判别器将混淆真假样本,在提高假样本 被判定为真的概率的同时,降低真样本被判定为真的概率。
由于基于 IPM 的 GAN 的判别器变换层 a(.)是恒等函数,无法限制判别器的输出,损失函 数可能很快趋于负无穷,梯度也随之爆炸。所以在实践中,我们希望 C 不易发散。事实上, 我们在《人工智能 35:WGAN 应用于金融时间序列生成》(20200828)中介绍的 WGAN 和 WGAN-GP 都属于基于 IPM 的 GAN。WGAN 通过限制网络参数变化范围,把ℱ限定为 满足 Lipschitz 条件的函数;而 WGAN-GP 通过增加梯度惩罚项,则把ℱ限定为梯度范数 接近于 1 的函数。 诸多研究(Arjovsky 等,2017;Gulrajani 等,2017;Mroueh 等,2017;Mroueh 和 Sercu,2017)表明,基于 IPM 的 GAN(如 WGAN 等)拥有优于 GAN 的表现。下一小 节我们将从损失函数梯度的角度分析基于 IPM 的 GAN 与 SGAN 有何不同。由于梯度是网 络训练过程中的直接影响因素,如果可以模仿基于 IPM 的 GAN 的损失函数梯度,那么就 有可能得到拥有相似优良表现的 GAN。
标签: TMT行业报告
相关文章
商业本质是增长,2012~2019年,移动互联网时代字节跳动通过渐进式创新实现主业快速增长,在夯实主业同时通过外延等方 式切入新赛道助力后续业务新增长...
2025-03-18 78 TMT行业报告
游戏云是游戏科技的重要组成,聚焦于服务各类游戏业务及游戏衍生业务场景的云基础设施及云能力平台。游戏云将游戏领域不同 业务场景所需基础能力(包括以计算、...
2025-03-18 28 TMT行业报告
2024 年是我国全功能接入国际互联网 30 周年,也是着力推动实体经济和数 字经济深度融合的一年。我国互联网行业发展不断开创新局面,在网民规模、互...
2025-03-14 47 TMT行业报告
全媒体融合了云计算、大数据、人工智能、区块链等多种技术,涵盖 了自媒体、社交媒体、移动应用、视频直播等多种业态。在多元化的全媒 体时代,各类媒体虽然日...
2025-03-08 24 TMT行业报告
从广告主的数量看,广告主的数量在2022&2023年有较大幅度增长,可能是疫情开放后,大家重拾市场信心,期望增加一定的市场 曝光。但从广告主的...
2025-03-05 35 TMT行业报告
最新留言