“在信息科技时代 , 数据就是一种生产资料 。 各种工具软件、工具包、AI工具链 , 就像是一台台在云端上的数字化机器人 , 对数据进行分类、筛选、分析、标注、训练 。 在各种深加工之后 , 再根据需求 , 产出各种数据产品 , 包括软件、算法模型 , 或是写入车载芯片里的一段程序 。 我们把现在正在做的这个项目 , 称之为‘数据工厂’ 。 ”
上海帆一尚行科技有限公司(以下简称“帆一尚行”)AI产品部总监谭黎明用一段形象的比喻 , 揭开了不久前刚在TECH SHOW上露面的“数据工厂”的神秘面纱 。
平行世界里的汽车工厂
不少工程师都喜欢把这个专注于自动驾驶研发的“数据工厂” , 称之为在平行世界里的数字化研发汽车工厂 。
经过两年多时间的发展与建设 , 帆一尚行已经在这个数据工厂里建成了集数据导入、数据标注、数据分析处理、模型训练、仿真检验等为一体的全流程闭环工具链 , 具备了完整的数据运营功能 , 并在过去的两年里 , 为洋山港智能重卡、智己汽车、R标智驾、商用车双J3项目和Robotaxi等上汽集团重点战略项目的实施提供了有力的支撑 。
帆一尚行总经理钟中告诉采访人员:“十四五”期间 , 帆一尚行将致力于把AI和数据技术赋能更多的汽车设计、生产、制造、营销和运营场景的应用 , 充分发挥自主研发的优势 , 服务好各个重大智能驾驶研发项目 。
据了解 , 目前帆一尚行的数据工厂已经实现了数据的分层、互通和共用 。 这使上汽集团各研发项目得以实现了数据资产的价值最大化 , 同时缩短了模型训练时间、拓展了模型训练场景、大幅度降低了研发成本 , 产品迭代速度也得到了提升 。 这些都成为上汽集团战略目标的有效支撑力 , 并开拓了新一代智驾数字化基础运营平台 。
“建设过程中 , 困难很多 。 ”谭黎明坦言 , “每个客户对数据的诉求不一样、标准不一样 , 安全规范也不一样 。 我们在开始决定做这个数据工厂的时候 , 甚至没有一个可参考学习的对象 。 ”
文章图片
从零开始铸就灵魂
2018年6月 , 帆一尚行的工程师写下了数据工厂的第一行代码 。
“其实 , 在此之前 , 整个行业内都没有‘数据工厂’这个概念 , 只有一些零散的工具链 。 例如 , 数据的筛选、标注、训练 , 以及各种场景下的单点功能 , 包括面部识别、自动泊车等 。 ”谭黎明告诉采访人员 , “假设一家企业开发了一个场景应用 , 如果另一家企业也想实现一个功能差不多的应用 , 就需要按照同样的步骤再来一遍 , 不仅浪费时间 , 而且损耗大量成本 。 而造成这种局面的主要原因 , 是不同企业之间各自的标准和定义不同 。 各个工具链之间没有形成整合 , 也是其中一个很重要的原因 。 也就是说 , 哪怕我手握再多的工具链 , 它们也只是一条条单独的生产线 , 还不能说是一个完整工厂的概念 。 ”
整个行业都在群雄逐鹿 , 显然并不存在一个整合好的大数据工厂 。 团队在2019年年初毅然决定 , 将现有架构彻底重构 。
“那段时期 , 上汽集团内部关于智能驾驶的需求越来越多 。 如果我们还是一个个工具链‘各自为营’ , 就没办法满足整个集团的智能驾驶需求 。 所以从那个时候开始 , 我们就想 , 干脆从零开始 , 建立一个数据工厂 , 把所有工具链都整合起来 。 这样还能把核心技术都掌握在自己手中 , 为未来竞争占据制高点 。 ”谭黎明说道 。
以上汽云计算中心为支撑、研发迭代为载体 , 广泛吸收国内外头部厂商的先进经验 , 并结合上汽自主研发的自动驾驶技术 , 数据工厂团队在两年多的时间内 , 自主研发、融合打造了各类模块30余个 , 已基本上满足全场景应用 , 并同步完成了各类数据生产线的统筹优化 。 数据工厂的建设进度也在快速推进中 , 基本上每两周迭代一次小版本 , 每半年更新一次大版本 。 截至目前 , 团队已在现有工厂的雏形上累计筛选出10PB的价值信息(占信息总量的20%) , 并完成了两次大规模的工厂重构 。
“再强的算法 , 再聪明的人工智能 , 想要发挥作用 , 首先要把数据存起来、标注好 , 并且能够用起来 , 而我们就是负责打造一套这样的基础设施 。 它和物理工厂最大的不同之处在于 , 我们这个建在云上的工厂 , 它的产品 , 也就是数据是可以被复制利用的 。 ” 谭黎明自信地告诉采访人员 , “我们现在的这个数据工厂是把各种工具链相互打通 , 实现互用 。 当然 , 数据的归属及权限管辖 , 我们是做严格控制的 。 ”
想了想 , 谭黎明又补充了一句:“整个数据工厂的开发 , 我们都是基于自我研发或开源代码进行建设的 , 帆一尚行拥有完全的自主权 。 至少在当前使用的版本中 , 它的协议是没有限制的 。 ”
从云端走下去“降维”打击
不久前 , 数据工厂和郑州相关政府签署了合作协议 , 共同发展当地智能网联产业 。 据了解 , 数据工厂将一部分功能模块和工具链挑选出来 , 根据当地政府的需求 , 组合成一个全新产品并对其进行部署 。 例如 , 帆一尚行和郑州工信局旗下的一家公司进行合作时 , 对方就需要一个云控平台 , 用于分析进入指定示范区的车辆上传到云上的数据 。
在一个固定场景内 , 通过数据工厂输出模块 , 训练当地的交通工具 , 实现有限的自动驾驶 , 同时将数据传回云端 。 落点于具体的应用场景 , 而不是针对某个车企 , 这是帆一尚行在面对数据工厂未来如何打开市场的一计妙招 。 这样不仅可以避免一些敏感问题 , 还能和目标形成有效互补 。 采访人员在采访过程中了解到 , 诸如此类先在工厂中选取部分工具链进行定制整合 , 再运用到合适的场景应用模式 , 被帆一尚行的工程师们形象地称为智驾技术中的“降维打击” 。
除了拓展应用场景 , 数据工厂还能通过不同工具链的组合 , 形成不同级别的自动驾驶产品包 。 比如 , 当前占比最大的低级别自动驾驶量产车 , 在未来也可以通过数据工厂 , 用更高级的自动驾驶技术去降维反哺 , 进行兼容覆盖 。 除此以外 , 像无人送餐车、环卫车等有限固定场景中的载具 , 也都是谭黎明团队“盯”上的目标 。
采访人员下楼离开时 , 正好看到有几名工程师不顾烈日当空 , 正埋头围着一辆无人送餐车不停地测试 。 “我们数据工厂下线的产品 , 一开始也只能打60分 。 ” 谭黎明谦虚地表示 , “另外40分 , 得到场景中获取 。 闭门是造不好车的 , 云上、云下都一样 。 ”
文章图片
互联网已进入“下半场”
目前 , 我国的产业结构正在发生调整 , 热点和主线正从第三产业向先进智能制造转变 。 中国互联网已进入“下半场” , 即从消费互联网转变为产业互联网 , 将互联网的创新应用成果深化于各项经济社会领域 , 支撑经济社会数字转型、智能升级和融合创新 。
据了解 , 帆一尚行打造的行业云——帆一云 , 专注于新基建、智能制造、人工智能、智能网联和网络安全领域 , 已经成为面向政企客户输出领先技术、标准化产品、非标产品和增值服务的数智化云平台 。
在新基建领域 , 帆一云已经具备支持百万级并发的计算能力 , 接入国内外300多个主要城市 。 目前 , 数据中台已支撑上汽用户中心和车辆中心 , 涵盖整车、后市场、汽车金融、出行服务等多种生态数据 , 赋能数字化营销等多个项目 。
在智能制造领域 , 帆一云基于云边协同一体化能力和帆一智造物联网平台 , 为客户提供工业SaaS应用服务 。 目前 , 有数以百万的IOT设备接入帆一云平台 , 进行软件版本更新或安全升级 。
在人工智能领域 , 坚实的AI基础平台将积累的AI能力赋能到多样化的应用场景中 , 可覆盖AI研发的全生命周期;氢燃料电池的测试和量产数据分析平台 , 快速定位燃料电池研发和运营问题;自动驾驶数据中台 , 安全、高效、稳定地处理智能网联PB级的数据 。
在智能网联领域 , 帆一云已经为国内100万以上 , 以及泰国、印度、欧洲等境外10万以上的车联网用户服务 , 并深度开展智能网联与自动驾驶领域的技术应用 , 拓展应用场景 。
在网络安全领域 , 帆一云具有自主知识产权的云、管、端全覆盖的网络安全产品 , 以及国内汽车行业首个安全监测与应急响应平台 , 在用户数据安全、个人信息保护方面形成了完备的一体化解决方案 。
【工具包|在平行世界里,上汽建了一家汽车工厂】面向未来 , 帆一尚行将扎根制造业 , 把汽车产业链的丰富经验复制、改进、推广到各行各业;面向产业数字化 , 把汽车行业智能化体系外延到千行百业中 , 通过智能云与千行百业的深度融合 , 为未来经济社会发展提供新技术、提升新效率、增添新动能 。
推荐阅读
- 星链|石豪:在太空,马斯克和美国当局是如何作恶的
- 建设|这一次,我们用SASE为教育信息化建设保驾护航
- 生活|气笑了,这APP的年度报告是在嘲讽我吧
- 精度|将建模速率提升10倍,消费级3D扫描仪Magic Swift在2021高交会大显“身手”
- 最新消息|世界单体容量最大漂浮式光伏电站在德州并网发电
- 公司|科思科技:正在加速推进智能无线电基带处理芯片的研发
- 测试|图森未来完成全球首次无人驾驶重卡在公开道路的全无人化测试
- Monarch|消息称微软Win11 2022重大更新将在明年夏天到来
- 社交|Facebook被指试图在美政客中抹黑前雇员Frances Haugen声誉
- Intel|Intel在Alder Lake平台演示PM1743 PCIe Gen 5 SSD,带宽达14GB/s