智慧的AI 无负面数据的机器学习
RIKEN高级智能项目中心的研究团队成功开发了一种新的机器学习方法,可以让AI在没有所谓负面数据的情况下进行分类 。这一发现可能会在机器人中得到更广泛的应用 。各种分类任务 。
分类对我们的日常生活非常重要 。例如,我们必须检测垃圾邮件、虚假的政治新闻和世俗的东西,如物体或面孔 。在使用AI时,这类任务是基于机器学习中的分类技术——让计算机使用分隔正负数据的边界进行学习 。例如,正数据将是包含笑脸的照片,而负数据将包含包含笑脸的照片 。一旦学习了分类边界,计算机就可以确定某个数据是正的还是负的 。这项技术的难点在于学习过程需要正负数据,很多情况下,负数据无法使用,但从根本上不可能获得未购买客户的数据 。向他们购买,因为他们无法访问竞争对手的数据 。另一个例子是应用程序开发人员的常见任务:他们需要预测哪些用户将继续使用该应用程序或停止使用它 。但是,当用户退订时,开发者会丢失用户的数据,因为他们必须根据隐私政策完全删除关于用户的数据,以保护个人信息 。
RIKENAIP的主要作者IshidaTakashi说:以前的分类方法无法应对无法获得负数据的情况,但只要我们对分数有信心,就能让计算机只学习正数据成为可能 。根据购买意愿或应用程序用户活动率等信息构建的正面数据 。有了我们的新方法,我们可以让计算机有信心地从正数据中学习分类器 。
石田与他所在团队的研究员牛刚、团队负责人杉山正史一起提出,计算机可以通过增加置信度得分来很好地学习,置信度得分在数学上对应于数据是否属于正类的概率 。他们成功地开发了一种方法,可以使计算机仅从正数据和关于其置信度的信息中学习分类边界,而不是划分正数据和负数据的机器学习分类问题 。
为了检查系统的运行状态,他们在一组包含各种时尚标签的照片中使用了该系统 。例如,他们选择t恤作为正面类别,另一件物品作为负面类别 。然后,他们在t恤照片上增加了一个自信分数 。他们发现,在某些情况下,不需要访问负数据,他们的方法与使用正数据和负数据的方法一样好 。
【智慧的AI 无负面数据的机器学习】 据石田介绍,这一发现可以扩大分类技术的应用范围 。即使在机器学习被积极使用的领域,我们的分类技术也可以在新的情况下使用 。因为数据,我们只能收集正面数据,法规或业务限制 。我们希望在不久的将来将我们的技术应用于各种研究领域,如自然语言处理、计算机视觉、机器人和生物信息学 。
推荐阅读
- 善琏湖笔是哪儿的特产吗?善琏湖笔介绍
- 羊毛笋炖咸肉是哪儿的特产吗?羊毛笋炖咸肉介绍
- 梅鲚是哪儿的特产吗?梅鲚介绍
- 盐卤豆腐是哪儿的特产吗?盐卤豆腐介绍
- 震远同牛皮糖是哪儿的特产吗?震远同牛皮糖介绍
- 德清毛竹是哪儿的特产吗?德清毛竹介绍
- 芽麦塌饼是哪儿的特产吗?芽麦塌饼介绍
- 玫瑰酥糖是哪儿的特产吗?玫瑰酥糖介绍
- 湖羊肉是哪儿的特产吗?湖羊肉介绍
- 泗安酥糖是哪儿的特产吗?泗安酥糖介绍