我们已经更新了隐私政策为了更清楚地说明我们如何使用您的个人资料。

我们使用cookie为您提供更好的体验。你可参阅我们的饼干的政策在这里。

广告

人工智能捷径可能导致死胡同。以下是如何避免它们

来源:Markus Spiske/ Pexels

想要一个免费的PDF版本的这个新闻故事?

填写下面的表格,我们会将PDF版本的“人工智能捷径可能会导致死胡同。以下是如何避免它们的方法。

188金宝搏备用科技网络有限公司需要您提供给我们的联系信息,以便就我们的产品和服务与您联系。您可以随时退订这些通讯。有关如何退订的信息,以及我们的隐私惯例和保护您隐私的承诺,请查看我们的隐私政策

阅读时间:

如果你的优步司机走捷径,你可能会更快到达目的地。但如果机器学习模型走了捷径,它可能会以意想不到的方式失败。

在机器学习中,当模型依赖于数据集的一个简单特征来做出决策,而不是学习数据的真正本质时,就会出现一个捷径解决方案,这可能导致不准确的预测。例如,一个模型可以通过关注照片中出现的绿色草地来学习识别奶牛的图像,而不是奶牛更复杂的形状和图案。

麻省理工学院(MIT)研究人员的一项新研究探索了一种流行的机器学习方法中的捷径问题,并提出了一种解决方案,可以通过强制模型在决策中使用更多数据来防止捷径。

通过移除模型关注的更简单的特征,研究人员迫使它关注数据中没有考虑过的更复杂的特征。然后,通过要求模型以两种方式解决相同的任务——一次使用那些更简单的特征,然后也使用它现在已经学会识别的复杂特征——它们减少了捷径解决方案的倾向,提高了模型的性能。

这项工作的一个潜在应用是提高用于在医学图像中识别疾病的机器学习模型的有效性。在这种情况下,捷径解决方案可能会导致错误诊断,并对患者产生危险的影响。

“我们仍然很难判断为什么深度网络会做出这样的决定,特别是在做决定时,这些网络会选择关注哪些数据。如果我们能够更详细地了解捷径是如何工作的,我们就可以进一步回答一些基本但非常实际的问题,这些问题对试图部署这些网络的人来说非常重要,”计算机科学与人工智能实验室(CSAIL)的博士生、该论文的主要作者约书亚·罗宾逊说。

罗宾逊写了与他的顾问,资深作者Suvrit Sra,电气工程和计算机科学系(EECS) Esther and Harold E. Edgerton职业发展副教授,数据、系统与社会研究所(IDSS)和信息与决策系统实验室的核心成员;EECS X-Consortium职业发展副教授、CSAIL和IDSS成员Stefanie Jegelka;匹兹堡大学助理教授Kayhan Batmanghelich以及博士生孙俪和余柯。这项研究将在12月的神经信息处理系统会议上发表。

通往理解捷径的漫长道路


研究人员将他们的研究重点放在对比学习上,这是一种强大的自我监督机器学习形式。在自监督机器学习中,使用原始数据训练模型,这些数据没有来自人类的标签描述。因此,它可以成功地用于更大范围的数据。

自监督学习模型学习有用的数据表示,这些数据被用作不同任务的输入,比如图像分类。但是,如果模型走了捷径,无法捕获重要信息,那么这些任务也将无法使用这些信息。

例如,如果训练一个自监督学习模型对来自多家医院的x光片中的肺炎进行分类,但它学会了根据识别扫描来自医院的标签进行预测(因为有些医院的肺炎病例比其他医院多),那么当它得到来自新医院的数据时,模型的表现就不会很好。

对于对比学习模型,编码器算法被训练来区分成对的相似输入和成对的不相似输入。这个过程以一种对比学习模型可以解释的方式对丰富而复杂的数据(如图像)进行编码。

研究人员用一系列图像测试了对比学习编码器,发现在这个训练过程中,它们也成为了捷径解决方案的牺牲品。编码器倾向于关注图像的最简单特征,以确定哪些输入对是相似的,哪些是不同的。理想情况下,编码器在做决定时应该关注数据的所有有用特征,Jegelka说。

因此,该团队使区分相似和不相似对变得更加困难,并发现编码器将根据这些变化来做出决定。

她说:“如果你把区分相似和不同项目的任务变得越来越难,那么你的系统就会被迫从数据中学习更多有意义的信息,因为如果不学习这些信息,它就无法解决任务。”

但是,增加这种难度会导致一种权衡——编码器在关注数据的某些特征时表现得更好,但在关注其他特征时表现得更差。罗宾逊说,它几乎忘记了更简单的功能。

为了避免这种权衡,研究人员要求编码器以最初的方式,使用更简单的特征,并在研究人员删除它已经学习到的信息后,区分这些对。同时以两种方式解决该任务会使编码器的所有功能都得到改进。

他们的方法被称为隐式特征修改,自适应地修改样本,以删除编码器用于区分对的简单特征。Sra解释说,这项技术不依赖于人工输入,这很重要,因为现实世界的数据集可能有数百个不同的特征,这些特征可以以复杂的方式组合在一起。

从汽车到慢性阻塞性肺病


研究人员使用车辆图像对这种方法进行了一次测试。他们使用隐式特征修改来调整颜色、方向和车辆类型,使编码器更难区分相似和不同的图像对。编码器同时提高了纹理、形状和颜色这三个特征的准确性。

为了验证这种方法是否经得起更复杂的数据,研究人员还使用慢性阻塞性肺病(COPD)医学图像数据库中的样本进行了测试。同样,这种方法导致了他们评估的所有功能的同步改进。

虽然这项工作在理解捷径解决方案的原因和努力解决它们方面取得了一些重要的进展,但研究人员表示,继续完善这些方法并将其应用于其他类型的自我监督学习将是未来进步的关键。

“这与深度学习系统的一些最大问题有关,比如‘为什么它们会失败?以及“我们能提前知道你的模型会在什么情况下失败吗?”’如果你想全面理解捷径学习的普遍性,还有很长的路要走,”罗宾逊说。

参考:孙林,孙林,于凯,孙志强,孙志强。对比学习能避免捷径吗?arXiv: 210611230 (cs).2021年6月21日在线发布。http://arxiv.org/abs/2106.11230

本文已从以下地方重新发布材料.注:材料的长度和内容可能经过编辑。如需进一步信息,请联系所引用的来源。


广告
Baidu