智慧的AI 无负面数据的机器学习 _机器

RIKEN高级智能项目中心的研究团队成功开发了一种新的机器学习方法，可以让AI在没有所谓负面数据的情况下进行分类。这一发现可能会在机器人中得到更广泛的应用。各种分类任务。

分类对我们的日常生活非常重要。例如，我们必须检测垃圾邮件、虚假的政治新闻和世俗的东西，如物体或面孔。在使用AI时，这类任务是基于机器学习中的分类技术——让计算机使用分隔正负数据的边界进行学习。例如，正数据将是包含笑脸的照片，而负数据将包含包含笑脸的照片。一旦学习了分类边界，计算机就可以确定某个数据是正的还是负的。这项技术的难点在于学习过程需要正负数据，很多情况下，负数据无法使用，但从根本上不可能获得未购买客户的数据。向他们购买，因为他们无法访问竞争对手的数据。另一个例子是应用程序开发人员的常见任务：他们需要预测哪些用户将继续使用该应用程序或停止使用它。但是，当用户退订时，开发者会丢失用户的数据，因为他们必须根据隐私政策完全删除关于用户的数据，以保护个人信息。

RIKENAIP的主要作者IshidaTakashi说：以前的分类方法无法应对无法获得负数据的情况，但只要我们对分数有信心，就能让计算机只学习正数据成为可能。根据购买意愿或应用程序用户活动率等信息构建的正面数据。有了我们的新方法，我们可以让计算机有信心地从正数据中学习分类器。

石田与他所在团队的研究员牛刚、团队负责人杉山正史一起提出，计算机可以通过增加置信度得分来很好地学习，置信度得分在数学上对应于数据是否属于正类的概率。他们成功地开发了一种方法，可以使计算机仅从正数据和关于其置信度的信息中学习分类边界，而不是划分正数据和负数据的机器学习分类问题。

为了检查系统的运行状态，他们在一组包含各种时尚标签的照片中使用了该系统。例如，他们选择t恤作为正面类别，另一件物品作为负面类别。然后，他们在t恤照片上增加了一个自信分数。他们发现，在某些情况下，不需要访问负数据，他们的方法与使用正数据和负数据的方法一样好。

【智慧的AI 无负面数据的机器学习】 据石田介绍，这一发现可以扩大分类技术的应用范围。即使在机器学习被积极使用的领域，我们的分类技术也可以在新的情况下使用。因为数据，我们只能收集正面数据，法规或业务限制。我们希望在不久的将来将我们的技术应用于各种研究领域，如自然语言处理、计算机视觉、机器人和生物信息学。