首页 >> 社会百态 >

没有负面数据的更智能的人工智能机器学习

2022-07-20 14:27:28 来源: 用户: 

来自RIKEN高级智能项目中心(AIP)的研究团队成功开发了一种新的机器学习方法,允许AI在没有所谓“负面数据”的情况下进行分类。这一发现可能导致在各种分类任务中的更广泛应用。

分类对我们的日常生活至关重要。例如,我们必须检测垃圾邮件、虚假政治新闻和更常见的事物,如物体或人脸。当使用AI时,这些任务基于机器学习中的“分类技术”——让计算机学会使用分隔正负数据的边界。例如,“正面”数据将是包括快乐面孔的照片,而“负面”数据照片将包括悲伤面孔。一旦学习了分类边界,计算机就可以确定某个数据是正的还是负的。这项技术的难点在于需要学习过程的正负数据,很多情况下无法提供负数据(比如很难找到带标签的照片,"

就现实生活中的程序而言,当零售商试图预测谁将进行购买时,它可以很容易地找到向他们购买的客户的数据(正数据),但基本上不可能获得没有购买的客户的数据。向他们购买(负面数据),因为他们无法访问竞争对手的数据。另一个例子是应用程序开发人员的常见任务:他们需要预测哪些用户将继续使用该应用程序(正面)或停止使用(负面)。但是,当用户取消订阅时,开发人员将会丢失用户的数据,因为他们必须根据隐私政策彻底删除有关用户的数据,以保护他们的个人信息。

RIKEN AIP的主要作者石田隆(Takashi Ishida)表示:“以前的分类方法无法应对无法获得负面数据的情况,但只要我们有一个置信度得分,就可以让计算机只使用正面数据进行学习。对于我们的正面数据,是根据应用用户的购买意向或效率等信息构建的。使用我们的新方法,我们可以让计算机自信地只从正面数据中学习分类器。

Ishida和他的团队以及团队负责人Masashi Sugiyama的研究员牛刚提出,他们通过添加置信度得分(confidence score)让计算机很好地学习,置信度得分在数学上对应于数据是否属于正常类的概率。他们成功开发了一种方法,可以让计算机只从正面数据和信息(正面可靠性)中学习分类边界,从而对机器学习的分类问题进行正反划分。

为了了解该系统的工作原理,他们在一组包含各种时尚标签的照片中使用了该系统。例如,他们选择“t恤”作为正面类别,选择另一个项目,例如“凉鞋”作为负面类别。然后他们在“t恤”照片上附上一个信心分数。他们发现,如果他们不访问负面数据(例如,“凉鞋”照片),在某些情况下,他们的方法与使用正面和负面数据的方法一样好。

石田称:“这一发现可以扩大分类技术可以使用的应用范围。即使在积极使用机器学习的领域,我们的分类技术也可以用于新的情况,因为数据只能用于积极的数据监管或业务限制。在不久的将来,我们希望将我们的技术应用于各个研究领域,如自然语言处理、计算机视觉、机器人和生物信息学。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章