Microsoft|微软开发可高效揪除代码错误的BugLabs人工智能解决方案

微软研究院首席研究员 Miltos Alamanis 与高级首席研究主管 Marc Brockschmidt,刚刚在一篇博客文章中介绍了他们新开发的 BugLabs 人工智能 。顾名思义 。这是一套专门用于发现代码中的错误,帮助开发者更精准、高效地调试其应用程序的 AI 解决方案 。而且它的开发过程,与创建生成对抗网络(GAN)的形式大致相同 。
访问:
微软中国官方商城 - 首页

Microsoft|微软开发可高效揪除代码错误的BugLabs人工智能解决方案
文章图片

(来自:Microsoft Research Blog)
在《借助深度学习查找并修复错误》一文中,微软研究员介绍了他们设置的两个相互对抗的网络 。其中一个旨在将小错误引入代码,另一个则旨在发现这些 bug。
随着深度学习训练的持续推进,AI 的能力也变得愈加完善,最终成为了我们看到的这个特别擅长识别“隐藏在真是代码中的 bug”的人工智能 。

Microsoft|微软开发可高效揪除代码错误的BugLabs人工智能解决方案
文章图片

这种方法的优点,在于全程无需自我监督或标记数据 。Miltos Allamanis 与 Marc Brockschmidt 在报告中提到:

理论上,我们可以将之广泛地应用于‘捉迷藏’游戏 —— 教授机器去识别任务复杂的错误 。遗憾的是,这些 bug 通常超出了现代人工智能方法的运用范围 。
有鉴于此,研究团队决定更加专注于一组常见的错误 —— 包括不正确的比较(例如使用 <= 而不使用 < 或 > 符号、不适当的布尔运算符(与 / 或)、滥用变量(误用 i 而不是 j)等 。

Microsoft|微软开发可高效揪除代码错误的BugLabs人工智能解决方案
文章图片

系统测试期间,微软研究员特别专注于 Python 代码 。一旦检测器通过了训练,即可将它用于检测和修复实际代码中的 bug。
不过为了均衡性能,他们还是手动注释了 Python Package Index 中包含的某些类型的小错误数据集 。
最终与随机错误插入等其它替代方案相比,其“hide-and-seek”训练模型有高达三成的领先优势,前景很是光明 。
【Microsoft|微软开发可高效揪除代码错误的BugLabs人工智能解决方案】
Microsoft|微软开发可高效揪除代码错误的BugLabs人工智能解决方案
文章图片

具体说来是,hide-and-seek 能够自动找到并修复大约 26% 的错误,且其中包括了 19 个此前未知的真实开源 GitHub 代码中的 bug。
与此同时,现阶段的 AI 模型仍存在许多误报 。在投入实际运用之前,显然还需要开展更多的改进 。

推荐阅读