同时 , 深度学习也得符合统计学习的规律——如果这个问题的假设空间非常复杂 , 就可能需要特别多样本才能指导这个算法收敛到令人满意的解(即样本复杂性问题) 。 这就影响到了深度学习的成本 , 收集和标注到足够的数据成本有多高 , 以及训练模型需要多少算力等等 。
通过深度学习本质与局限性的探讨 , 我们就能理解AI所经历的种种高潮与低谷 , 即深度学习是有效但并非万能的 。 因此 , 在AI发展高潮时 , 我们不应过于乐观 , 遭遇低谷时也无须过于悲观 。
深度学习是泡沫还是浪潮那AI到底是一个大潮 , 还是一个小浪花?我觉得要在一个更大的上下文 , 也就是信息技术发展的的上下文来理解 。
信息技术实质上就是把现实或物理的事物通过建模变成程序代码 , 然后在计算机里运行来模拟现实世界 , 因为这个模拟的过程要比现实世界运行更快 , 成本更低 , 就可以用模拟结果对现实世界进行预测和反馈 。 这是计算机能在所有场合给人类带来帮助的本质原因 。
以前人们借助计算机解决问题的时候 , 必须先通过工程师和科学家来理解现实世界的机制 , 建立一个模型 , 再表达成程序 , 这是一种白盒建模方式 。 建模是用计算机模拟现实世界时最难的步骤 。
而AI带来了一种不求甚解的新办法 , 也就是黑盒建模——只要有足够多的数据 , 无须人工理解 , 它能拟合出匹配甚至超越白盒的模型 , 可以取代白盒方式 。
白+黑 , 深度学习的正确打开方式按照搭建信息系统来解决问题的不同手段 , 我们画一个图 。
文章图片
最左边这两列都是深度学习崛起前的白盒方式 , 都需要人去写程序 。 第一种方式是不分模块 , 囫囵吞枣地去写代码 , 有编程经验的朋友对这种解法的缺陷有切身体会 , 软件复杂度超过人的理解能力而失控 。 所以 , 实践中会引入非常多的编程技术来克服 , 面向对象、隔离、解耦、模块化、架构、设计模式等等 , 也就是第二列所展示的方法 。
如果我们对深度学习的能力充满信息 , 认为无论多难的问题都能学习出来 , 就会倾向于采用第三个做法 , 收集到原始的输入和期待的输出构成训练数据 , 不问青红皂白就直接交给AI来学习 。 对大部分场景来说 , 这个方法肯定是过于乐观了 。 往往是这个问题太复杂 , 需要的训练数据太多、需要的计算量太大 , 如果非要在假设空间太大而数据不足的情况下去学习 , 只能大失所望 。
这说明即使拿深度学习来解这个问题 , 也必须做模块化 , 把大问题分解成多个小问题 , 这些小问题之间有特定的组合关系 。 比如自动驾驶里分解成感知、决策等一系列子问题 , 每个子问题限制在AI或者深度学习能解决的范畴之内 , 而不是期待AI能囫囵吞枣地解决整个问题 。
推荐阅读
- 产品|泰晶科技与紫光展锐联合实验室揭牌
- 空间|(科技)科普:詹姆斯·韦布空间望远镜——探索宇宙历史的“深空巨镜”
- 相关|科思科技:无人机地面控制站相关设备产品开始逐步发力
- 机身重量|黑科技眼控对焦23年后回归,升级! 江一白解读EOS R3
- 公司|科思科技:正在加速推进智能无线电基带处理芯片的研发
- 项目|常德市二中2021青少年科技创新大赛再获佳绩
- 视点·观察|科技巨头纷纷发力元宇宙:这是否是所有人的未来?
- 技术|聚光科技旗下临床质谱仪获批医疗器械注册证
- 视点·观察|科技股连年上涨势头难以持续:或已透支未来涨幅
- 视点·观察|科技行业都在谈论“元宇宙”,可是它还不存在