MIT联合IBM推新型识别数据集:素材“脑洞”清奇 难倒了ImageNet

麻省理工学院(MIT)和IBM一起打造的ObjectNet标明,人工智能(AI)在实践世界中的目标检测方面依然较为费劲。

该团队最近一起创立了一个异乎寻常的图画辨认数据集ObjectNet(具有50,000张相片),旨在阐明机器学习算法与人类之间的功能距离。这个数据集乃至难倒了世界上最好的计算机视觉模型——ImageNet。

1

与许多现有数据集(比方具有1400万张图画的ImageNet,一般用的是Flickr和其他交际媒体网站上拍照的相片)不同,ObjectNet的数据样本是由有偿自由职业者捕获的。它所描绘的物体(例如桔子、香蕉和衣服)也是从不同惯例的布景和视点进行拍照的,并显现在乱七八糟的房间中,能够说拍照脑洞有点“清奇”——即便是最先进的算法也难以应对。不信你看看下面这些选择的资料图:

1

(图源:ObjectNet官网)

实践上,在ImageNet测验中完成精确率高达97%的计算机视觉模型,在ObjectNet数据集上检测的精确率却下降到了50%-55%!

2

(图源:ObjectNet官网)

该研讨的其他作者是来自麻省理工学院的Julian Alvero、William Luo、Chris Wang和Joshua Tenenbaum。这项研讨是由美国国家科学基金会,麻省理工学院的大脑、思维和机器中心,麻省理工学院的IBM Watson AI实验室,丰田研讨院和SystemsThatLearn @ CSAIL方案赞助的。

它依据本年早些时分由Facebook AI研讨人员发布的一项研讨:该研讨发现,用于辨认家庭目标的计算机视觉一般关于高收入家庭的人们更有用。成果标明,六个最盛行的辨认系统对最富有的家庭的均匀作用要比对最赤贫的家庭好10%-20%,并且他们更简单辨认北美和欧洲家庭中的物品。

这背面还有一大原因在于:现在简直一切的视觉模型,在类似于物体旋转、布景改换、视角切换等杂乱情境下,辨认进程都缺少稳定性。

MIT计算机科学与人工智能实验室以及脑、智与机器中心(CBMM)的研讨科学家鲍里斯·卡茨(Boris Katz)说:“咱们创立这个数据集是为了告知人们,物体辨认问题依然是个难题。” “咱们需求更好、更智能的算法。”

依据Katz和团队的说法,他们花了三年的时刻来构思ObjectNet并规划出一个可标准化数据收集进程的运用程序。研讨人员经过Amazon Mechanical Turk雇用了摄影师,后者在上述运用程序上收到带有动画阐明的相片分配,并告知他们怎么定向分配的目标,从哪个视点拍照以及是否需求将目标摆放在厨房、澡堂、卧室或客厅。

收集实践数据又花了一年的时刻,最终,由于未到达研讨人员的要求,一切自由职业者提交的一切相片都不得不丢掉一半,科学家们针对完好的ObjectNet测验了一系列计算机视觉模型。他们用上了上述模型练习一半的数据,然后再对其他的一半进行测验,这种做法往往会前进功能。可是检测人员常常难以了解物体样本是三维的并且能够旋转并移动到新的环境中,这标明这些模型没有彻底了解物体在实践世界中的存在方法。

Katz弥补说:“人们为这些检测器供给了许多数据,可是收益却在削减。” “您不能在任何视点和布景下从任何视点检查目标。咱们期望,这个新的数据集将带来强壮的计算机视觉,而不会在实践世界中形成令人惊奇的毛病。”

该团队方案本周在温哥华的AI世界尖端会议NeurIPS 2019上展现他们的作用。

在曩昔的十年中,目标辨认模型得到了长足的前进,乃至有时体现得比人类还要好。可是在精度方面,明显它还有很长的路要走。这是由于,计算机视觉模型真实进入到日子中时,功能一般会比本来出现出来的“炫技作用”差劲许多,真实用在自动驾驶等运用机器视觉的实践场景中的时分,分分钟会变成大型“翻车”现场,并且或许带来不行忽视的安全隐患。

并且在实践日子中,物体的状况和视点不同,就极端不简单被正确地辨认。试想一下,假如物品自身的拍照视点和布景跟标准化摆得整整齐齐的姿态不同,当然就简单被误认为是其他东西,比方:倒在地上的椅子、挂在树枝上的T恤,反照在车玻璃上的云朵,单靠一个不行老练的视觉机器模型,你觉得精准辨认有或许吗?

深度学习是推进AI最新开展的技能,它运用人工“神经元”层在许多原始数据中查找形式。在练习了数百至数千个示例之后,它才“学会”在相片中选择椅子。可是,即便具有数百万个图画的数据集,也无法以每个或许的方向和设置显现每个目标,这样模型在实践日子中遇到这些目标时就会形成问题。

自2012年以来,计算机视觉模型已逐渐改进,其时名为AlexNet的物体检测器在年度ImageNet竞赛中打败了竞赛。跟着数据集变得越来越大,功能也得到了前进。

可是研讨人员正告说,规划更大版别的ObjectNet并添加视角和方向并不一定会带来更好的成果。ObjectNet的意图是鼓励研讨人员提出下一波革命性技能,就像ImageNet应战开始的发动相同。

相关深度陈述 REPORTS

2019-2024年我国人工智能职业商场前瞻与出资战略规划剖析陈述 2019-2024年我国人工智能职业商场前瞻与出资战略规划剖析陈述

本陈述使用前瞻资讯长时间对人工智能职业商场盯梢收集的一手商场数据,选用与世界同步的科学剖析模型,全面而精确地为您从职业的全体高度来架构剖析系统。本陈述首要剖析了...

检查概况

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处://orioncsc.com/ganhuo/576.html