模型|多方安全计算成为发展趋势 专家:挖掘知识,无需共享数据

【环球网科技报道 采访人员 张阳】2021中国国际大数据产业博览会日前圆满落幕 , 数据智能领域的业界精英围绕“数智变·物致新”的年度主题开展了深入交流合作 。
随着人工智能技术与实体经济的进一步融合 , 各行各业都朝着数字化、智能化的方向发展 。 医疗的智能化发展也成为行业的趋势 。 但数据孤岛、数据隐私安全的保护成为行业发展不可回避的问题 , 如何在保证数据合规和安全的前提下让数据发挥更大研究价值?带着这些问题 , 采访人员采访了微众银行首席人工智能官、香港科技大学讲席教授杨强和医渡云首席人工智能科学家闫峻 。

模型|多方安全计算成为发展趋势 专家:挖掘知识,无需共享数据
文章图片

多方安全计算解决方案:挖掘知识 , 无需共享数据
在论坛演讲环节 , 微众银行首席人工智能官、香港科技大学讲席教授杨强就在其报告中强调医疗领域所面对的数据孤岛和隐私保护两大挑战 。
“在医学领域 , 单中心研究的数据样本比较小 , 另外数据比较分散 。 ”杨强说 , 随着深度学习和大数据技术的发展 , 多中心研究是趋势和方向 , 但要保证数据的安全和隐私 。
那么是否有相应的技术可以突破这一瓶颈呢?杨强告诉采访人员 , 联邦学习技术可以在共同建模的时候 , 保护数据的隐私、模型的参数 , 从而将各中心的部分模型整合成全局的模型 。 不影响最终联合挖掘出的知识 。
在联邦学习技术的助力下 , 整个多中心研究的流程也很清晰:参与研究的医疗机构设立一个共同的科研任务 , 在不共享原始数据、并对机器学习的参数进行加密的前提下 , 联合建模 , 利用模型来做实验 , 进行科研合作 。
“这种多中心的智慧科研平台 , 解决了一些单中心科研数据质量不够高的问题 。 ”杨强说 。
医渡云首席人工智能科学家闫峻也表示 , “相比单中心研究 , 多中心研究意味着数据规模更大 , 更多的研究者参与 , 使得研究的质量更高 。 ”但各医疗机构出于对治疗方案等相关数据和信息的隐私与安全的考量 , 使得多中心研究有一定难度 。
为了解决这一医学研究领域的痛点 , 医渡云推出了多方安全计算解决方案 , 从技术的角度推进行业的研究 。 “在多方安全计算和联邦学习相关技术的助力下 , 医疗数据可以不共享、不离开医疗机构 , 但能进行共同研究 , 用于统计分析和构建模型 。 这样的模型有足够的精度和泛化能力 , 能保证行业应用 。 ”

模型|多方安全计算成为发展趋势 专家:挖掘知识,无需共享数据
文章图片

场景应用与技术提升形成闭环
技术的发展最终要落地 , 落实到应用环节 。
在闫峻看来 , 人工智能技术本身是由数据智能和知识驱动的技术 , 数据智能和知识相结合构建出模型 , 这是人工智能产业发展的基础 。 当有了模型之后 , 将其应用到具体的场景中 , 真实场景的应用反馈又会带动技术不断提升 , 最终形成闭环效应 。
杨强分享了一个多中心联合建模的应用案例——联合十几家医院进行脑卒中风险建模多中心研究 。 该研究通过联邦学习技术 , 在数据不出院的前提下 , 对脑卒中患者进行了纳排、数据处理和机器学习建模 , 对脑卒中的风险等级进行划分 。 模型验证结果非常有效 。 尤其对数据量不足的小医院来说 , 预测准确率比单中心训练提升10%-20%以上 。
除了医疗领域 , 多中心研究在金融领域也有相应的落地和应用 。 杨强表示 , “在风险控制和营销等多个不同领域 , 通过联邦学习 , 可以建立起很好的模型 。 ”
在杨强和闫峻看来 , 多方安全计算的特征可以概括为“数据可用不可见” 。 这是从技术角度针对数据孤岛和数据隐私问题提出的解决方案 。 不过闫峻表示 , 这不仅仅是一个技术方面的问题 , 需要行业、产业各方 , 以及政府相关部门共同推进解决 , 最终让安全计算赋能各产业真正落地 。
安全计算成为未来趋势方向 , 杨强也表达了认同 。 “要想解决数据共享的难题 , 联邦学习技术将会大有可为 , 数据都进行隐私加密 , 保证数据不出本地 , 但是同时 , 行业各方依然可以提供知识 , 构建全局模型 。 ”
【模型|多方安全计算成为发展趋势 专家:挖掘知识,无需共享数据】他向采访人员强调 , “总结起来 , 安全计算就是让我们能共同享受大数据技术发展带来的福利的同时 , 能够保护数据安全和隐私 。 ”

    推荐阅读