钱军|瀚博半导体发布首款AI推理芯片:性能超英伟达T4,客户包括快手


钱军|瀚博半导体发布首款AI推理芯片:性能超英伟达T4,客户包括快手
文章图片

图源:图虫创意

采访人员 | 姜菁玲
2021世界人工智能大会上 , 国产芯片公司瀚博半导体正式向外发布首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡 , 目前已成功流片 , 预计在今年四季度量产上市 。
该公司定位为高性能人工智能与视频处理芯片解决方案提供商 , 视频加AI联合设计是其核心竞争力 。 瀚博半导体创始人兼CTO张磊介绍称 , SV100系列芯片为DSA架构 , 相同功耗下可以实现数倍于数据中心GPU(如英伟达 T4、A10)的最高深度学习推理性能 。
“计算机视觉占据AI应用的大半江山 , 视频流占整个数据流的70% , 包括长短视频、直播视频、安防视频等等 , 而且这个百分比会越来越高 , 整个的数据基础也会越来越大 , 所以视频有关的数据绝对是一个海量的数字 。 ”瀚博半导体创始人兼CEO钱军在接受包括界面新闻在内的媒体访问时表示 。
钱军认为 , 占据过半中国AI应用市场的计算机视觉应用 , 需要高密度的视频解码算力配合AI算力实现端到端的计算加速 。 AI要为视频做好优化 , 在性能上需要极低延时 , 极高吞吐性能 , 还要保持低能耗 。
【钱军|瀚博半导体发布首款AI推理芯片:性能超英伟达T4,客户包括快手】基于 SV102 芯片 , 瀚博推出的适用于云服务器的 VA1 机器学习加速卡 , 其提供高效率深度学习 AI 推理加速 , 在同等能耗下可以实现 2-10 倍于 GPU 的最高 AI 吞吐率 , 适合实时应用 , 同时兼备良好的通用性和可扩展性 , 支持 FP16, BF16 和 INT8 数据类型的众多主流神经网络快速部署——包括检测 , 分类 , 识别 , 分割 , 视频处理 , LSTM/RNN , NLP/BERT , 搜索推荐等 。

钱军|瀚博半导体发布首款AI推理芯片:性能超英伟达T4,客户包括快手
文章图片

作为投资人的短视频头部公司快手也是瀚博的客户之一 。 钱军在采访时表示 , 瀚博与重要合作伙伴快手的合作非常紧密 。 目前已有多家国内外科技公司正在和瀚博合作 , 并等待芯片的大规模量产 。
对于全球缺芯问题 , 钱军表示 , 目前瀚博今年产能已出 , 明年大部分的产能已提前预知 , 不过如果剩下产品卖的特别好 , 也有可能面临产能问题 。
瀚博半导体2018年12月成立于上海 , 在北京、深圳和多伦多均有研发分部 。 公司创始人曾为AMD高管 , CEO钱军曾在AMD任Senior Director , 全面负责GPU(图像处理器)和AI服务器芯片设计和生产 , CTO张磊2013年晋升为AMD Fellow , 负责AI、深度学习 , 视频编解码和视频处理领域 , 其公司团队部分成员曾设计了业界首款 7nm 制程 GPU 。
融资方面 , 结合钱军所透露的情况与公开资料 , 瀚博在2019年3月收到真格基金独家天使轮投资 , 同年7月 , 收到A轮融资 。 2020年11月 , 瀚博宣布获得由快手、红点创投中国基金、五源资本联合领投的5000万美元A轮融资 , 今年4月该公司又获得由中国互联网投资基金和经纬中国联合领投的5亿元人民币A+轮融资 。

    推荐阅读