微软中国MSDN 点击上方 蓝字关注我们
(转载自微软研究院AI头条)
编者按:近年来 , 因果机器学习在人工智能和诸多交叉领域产生了卓越的影响 , 得到了越来越多的关注 。 借助因果关系推理 , 机器学习的鲁棒性、泛化能力、可解释性等方面都将得到有效提升 。 今天我们精选了三篇微软亚洲研究院关于因果机器学习的 NeurIPS 2021 论文 , 为大家介绍该领域的最新科研进展 。 论文内容涵盖:在单源域泛化预测、多源域泛化预测 , 以及模仿学习三类任务中学习因果关系的方法和理论 , 并展示了利用因果关系提高模型在环境和分布发生变化时的稳健性 。 未来 , 微软亚洲研究院将进一步推进机器学习方法在更多更严苛的现实任务上的应用 。
近年来 , 随着机器学习模型性能的不断提高 , 人们逐渐不再满足于它们在标准数据集上的表现 , 而是还希望它们能在真实的应用场景中同样具有稳定可靠的表现 。 但实现此目的的一个重要挑战是 , 真实场景中的环境情况通常与干净的标准训练数据集不同 , 会有数据分布的变化从而会遇到分布外样例 , 而模型不一定会在新环境中给出合理的结果 。
这为机器学习模型带来了新的要求 , 即 模型需要学到做出预测或判断的本质原因和规律 , 而非依赖于表面“看上去”的关联关系 , 因为后者可能只是在特定环境下的表象 , 只有前者决定着环境变化之后的规律 , 可对分布外样例给出合理的结果 。 这便引出了因果机器学习这一新的研究方向 。 在 NeurIPS 2021 上 , 微软亚洲研究院的研究员们发表了一系列因果机器学习领域的研究成果 。
学习用于分布外预测的因果语义表示
文章图片
- 论文链接: https://arxiv.org/pdf/2011.01681
- 代码链接: https://github.com/changliu00/causal-semantic-generative-model
图1:分布外预测任务的挑战
基于这个因果角度的考虑 , 研究员们提出了 “因果语义生成模型”(Causal Semantic Generative model, CSG) , 如图2(a)所示(注意基于前面的考虑 , 图中去掉了v→y) 。 此外 , 根据上面的例子 , s和v在特定环境中常会相关 , 例如“哈士奇”/“狼”常与暗背景/雪地背景一起出现 , 但此相关性并非因为两者间有因果关系 , 比如把“哈士奇”放到雪地中不会让它变成“狼” , 也不会把背景变暗 。 因此研究员们使用了一个无向边来连接它们 。 这不同于大部分已有工作 , 那些工作认为各隐因子间都是独立的 。
推荐阅读
- Google|谷歌暂缓2021年12月更新推送 调查Pixel 6遇到的掉线断连问题
- 精度|将建模速率提升10倍,消费级3D扫描仪Magic Swift在2021高交会大显“身手”
- 四平|智慧城市“奥斯卡”揭晓!祝贺柯桥客户荣获2021世界智慧城市治理大奖
- 系列|2021中国航天发射圆满收官!年发射55次居世界第一
- 项目|常德市二中2021青少年科技创新大赛再获佳绩
- 选型|数据架构选型必读:2021上半年数据库产品技术解析
- 殊荣|蝉联殊荣!数梦工场荣获DAMA2021数据治理三项大奖
- 公司|外媒:2021,人类太空事业的重大年份
- 语境|B站2021个人年度报告发布:你共计看了多少个视频
- 最新消息|IT系统出错 英国银行给7.5万人多发11亿工资