热搜： Model Realme oppo 同比增长城市 Android 电容 iPhone13 Power 起亚Stinger

NVIDIA Research使用有限的数据集实现AI训练突破

2023-02-26 三晋生活网

核心提示：数据增强技术使AI模型能够基于大都会艺术博物馆的一个小型数据集来模仿艺术作品并在医疗健康等领域开创全新的潜在应用。NVIDIAResearch的最新AI模型可谓生成式对抗网络（GAN）领域的“神童”。相较于典型的GAN 它只需要基于极少量

数据增强技术使AI模型能够基于大都会艺术博物馆的一个小型数据集来模仿艺术作品并在医疗健康等领域开创全新的潜在应用。

NVIDIAResearch的最新AI模型可谓生成式对抗网络（GAN）领域的“神童”。相较于典型的GAN 它只需要基于极少量的学习材料就能学习诸如模仿著名画家和重建癌症组织图像这样复杂的技能。

通过将一种突破性的神经网络训练技术应用于常用的NVIDIAStyleGAN2模型 NVIDIA的研究人员基于大都会艺术博物馆中不到1 500张图像重新设计了艺术作品。他们使用NVIDIADGX系统加速训练从历史人物肖像中汲取灵感创作出了全新的AI艺术作品。

这种称为自适应鉴别器增强（ADA）的技术能在将训练图像的数量缩减10-20倍的情况下仍保持不错的效果。未来该技术将会为医疗健康领域带来重大影响例如可通过创建癌症组织学图像来帮助训练其他AI模型。

NVIDIA图形研究副总裁DavidLuebke表示：“这些研究结果意味着人们可以使用GAN来解决大量数据过于耗时或难以获取的问题。我十分期待艺术家、医学专家和研究人员能够对其充分利用实现更多应用。”

本周这一项目的研究论文将在年度神经信息处理系统大会NeurIPS上发表。在本届大会上 NVIDIAResearch破纪录地有28篇研究论文入选该论文就是其中之一。

这种新方法是NVIDIA研究人员在GAN领域的一系列创新中的最新成果。这些研究人员开发了基于GAN的突破性模型包括AI绘画应用程序GauGAN、游戏引擎模拟器GameGAN和宠物照片转换器GANimal。这些模型在NVIDIAAIPlayground均有提供。

数据训练的困境

像大多数神经网络一样 GAN长期遵循一个基本原则：数据训练量越多模型越完善。这是因为每个GAN都由两个配合的网络组成——一个生成合成图像的生成器以及一个根据训练数据来学习逼真图像的鉴别器。

鉴别器会指导生成器提供逐个像素反馈以帮助其提升合成图像的真实感。但如果可供学习的训练数据有限鉴别器就无法帮助生成器发挥其全部潜能就如同新手教练的实战经验要比经验丰富的专家少得多。

要训练高质量的GAN 通常需要50 000至100 000个训练图像。但在很多情况下研究人员根本没有成千上万的样本图像可以利用。

仅使用几千张图像进行训练许多GAN就会难以运行无法产生逼真的结果。当鉴别器仅能记住训练图像而无法向生成器提供有用的反馈时就会发生“过拟合”的问题。

在图像分类任务中研究人员会通过数据增强来解决过拟合的问题。这项技术使用现有图像的副本来扩展较小的数据集这些副本经过旋转、裁剪或翻转等过程而随机扭曲从而迫使模型更加通用化。

但是此前将增强技术应用于GAN训练图像时生成器学会了模仿那些失真的图像而非创建可信的合成图像。

GAN的实战演练

NVIDIAResearch的ADA技术能够自适应地应用数据增强这意味着在训练过程中的不同点上可以调整数据增强的数量以避免过拟合。这使诸如StyleGAN2这样的模型可以使用更少的训练图像获得同样惊人的效果。

结果研究人员可以将GAN应用于从前看来不切实际的应用中。在这些应用中示例往往太少且难以获得或收集大型数据集的工作太耗费时间。

艺术家使用了不同版本的StyleGAN来创作令人惊叹的展品并根据传奇插画家OsamuTezuka的风格创作了新的漫画。Adobe甚至采用它来为Photoshop的全新AI工具“神经过滤器（NeuralFilters）”提供支持。

由于入门所需的训练数据较少因此采用ADA的StyleGAN2可应用于珍稀艺术作品例如总部位于巴黎的AI艺术团体Obvious在非洲科塔面具上的作品。

另一潜在应用是医疗健康领域因为大多数检查结果都是正常的因此罕见疾病的医学图像可能非常稀少。要想积累大量有用的异常病理切片数据集需要医学专家花费大量时间辛苦地进行标记。

通过GAN 采用ADA创建的合成图像可以填补这一空白为另一种AI模型生成训练数据从而帮助病理学家或放射学家发现病理图像或MRI研究中的罕见病情。此外借助AI生成的数据就不存在患者数据或隐私方面的担忧更便于医疗机构共享数据集。

NVIDIAResearch在NeurIPS上大放异彩

NVIDIAResearch成员团队由全球200多名科学家组成致力于AI、计算机视觉、自动驾驶汽车、机器人技术和图形学等领域。在12月6日至12日举行的年度最大的AI研究会议NeurIPS上将重点介绍NVIDIA研究人员撰写的超过24篇论文。

点击链接查看NVIDIA Research成员团队在NeurIPS大会上发表的全部论文。

文章主配图是由StyleGAN2借助ADA生成的其仅仅基于大都会艺术博物馆收藏品API的不到1 500张图像的数据集进行了训练。

以上就是关于NVIDIA Research使用有限的数据集实现AI训练突破的相关内容，希望能帮助到您！

点赞 0反对 0举报 0 收藏 0 打赏 0

更多>同类生活百科

网站排行

推荐网站

闲鱼

闲鱼.淘宝二手是一个社区化的二手闲置交易市场，不仅支持各种同城及线上的担保交易，更安全，同时还有最专业的放心购二手商家，让你轻松在这买卖二手闲置。

天猫tmall.com

天猫tmall.com--理想生活上天猫

淘宝网

淘宝网 - 亚洲较大的网上交易平台，提供各类服饰、美容、家居、数码、话费/点卡充值… 数亿优质商品，同时提供担保交易(先收货后付款)等安全交易保障服务，并由商家

唯品会

唯品会vip购物网以1-7折超低折扣对全球各大品牌进行限时特卖

得物App

得物App是全球领先的集正品潮流装备、潮流商品鉴别、潮流生活社区于一体的新一代潮流网购社区。“多道鉴别查验工序”的平台品控，为新世代消费者带来更安心的网购体验。

京东

京东JD.COM-专业的综合网上购物商城，为您提供正品低价的购物选择、优质便捷的服务体验。商品来自全球数十万品牌商家，囊括家电、手机、电脑、服装、居家、母婴、美

快手电商

一个好逛、有趣、让老铁信任的优质电商平台，帮助达人和商家实现高效交易，以沉浸式体验带给消费者不一样的购物感受。来快手电商，让生活更好一点！

网易严选

网易严选秉承网易一贯的严谨态度，深入世界各地，严格把关所有商品的产地、工艺、原材料，甄选居家、厨房、饮食等各类商品，力求给你最优质的商品。

• 英特尔换帅CEO后股价大涨近8%	• 嘀嗒出行上线老年人优先派单服务：支持一键叫车
• 家电小知识：变容二极管有没有正负极如何判断	• 奇瑞旗舰电动SUV更名为“大蚂蚁”
• 5G赋能PC带来颠覆性的体验	• 家电小知识：变压器输出端电缆过长对设备会有什
• 全球第五款5nm芯片问世,小米优势全无	• 突发！Intel公司宣布新一轮人事变动
• 家电小知识：语音识别芯片的工作原理和分类	• 锐龙5000系列的加价幅度已经开始下滑了价格正