【自变量|新算法可快速选出最优子集】中国科学技术大学管理学院教授王学钦团队与美国耶鲁大学公共卫生学院教授张和平合作 , 针对线性回归模型的基准问题——最优子集选取 , 提出一种新的快速算法 , 在有限步内就能得到稳定解 。 该成果日前发表于美国《国家科学院院刊》 。
发现事物间的关系是大部分科学研究的目的 , 这在统计学中称为回归分析 。 其中 , 线性回归模型具有简洁性和可解释性 , 成为最有用的科学研究工具之一 。 最优子集算法泛指多元回归分析中自变量选择时旨在寻找为数不多的、根据指定准则是“最优”回归模型的计算方法 。 尽管线性回归模型使用广泛 , 但其中一个基本问题——如何在一组变量中选择最优的子模型 , 尚未解决 。
得益于现代科技的发展 , 数据的收集越来越便利 。 典型的生物医学研究中会收集到上百个变量 , 常规的全基因组研究中则涉及到成千上万甚至是百万级别的遗传变异 。 然而 , 现有的算法难以在上万级别的实际问题中寻找到最优子集 。
为了解决这一问题 , 王学钦团队利用排序和剪接的思想 , 结合一个新的信息准则发展出一种新算法 , 在有限步内就能得到稳定解 。 同时 , 他们证明了在一定条件下 , 依大概率 , 该算法具有多项式的时间复杂度 , 而且能够选出最优子集 。 (通讯员 桂运安)
[责任编辑: 武玥彤 ]
推荐阅读
- 功能|小米 Watch S1图赏:商务气质新系列,稳步入场不急切
- 区块|面向2030:影响数据存储产业的十大应用(下):新兴应用
- 于本|豆瓣 App 安卓新版本 7.20.0 测试
- bleu|字节跳动火山翻译上新 38 个稀有语种,翻译能力再升级
- 苏宁|可循环包装规模化应用 苏宁易购绿色物流再上新台阶
- 市场|激斗智能家居,大厂遇到新对手
- Samsung|新渲染揭示Galaxy S22 Ultra几乎就是Galaxy Note复刻版
- Google|谷歌暂缓2021年12月更新推送 调查Pixel 6遇到的掉线断连问题
- 样儿|从太空看地球新年灯光秀啥样儿?快看!绝美风云卫星图来了
- 最新消息|世界单体容量最大漂浮式光伏电站在德州并网发电