数据|黄仁勋GTC演讲速递:元宇宙构建工具本质上是“数字虫洞”( 二 )


Avatar语言识别的背后技术包括Riva , 一种用于处理高级语音AI的新型大型软件开发工具包;Avatar的自然语言理解是基于Megatron 530B大型语言模型 。
值得注意的是 , 最新版本的Nvidia Riva对话式AI软件开发套件中可以使用Riva Custom Voice , 它利用半监督学习为软件、IVR和其他业务应用程序创建合成的、定制的语音 。 据黄仁勋介绍 , 只需 30分钟的训练数据 , 这项对话式人工智能技术已经改进到可以根据任何语音生成合成语音 。
黄仁勋认为 , 这些助手几乎可以为任何行业轻松定制 , 帮助处理数十亿日常客户的服务互动 , 包括餐厅点单、银行交易等等 。
外媒《Venture Beat》表示 , 借助Riva自定义语音 , 英伟达就可以与谷歌并驾齐驱 。 2019年 , 谷歌在其云文本转语音服务中推出了新的人工智能合成WaveNet语音 。 其也提出对于可能带来的语音滥用的担心 , 比如模拟语言进行诈骗 。
GTC大会(GPU Technology Conference)于2009 年在加利福尼亚州圣何塞第一次举办 , 是英伟达的旗舰活动 , 一直是英伟达向外界传递重要信息的渠道 。 最初专注于通过 GPU 解决计算挑战的潜力 。 近年来 , 会议重点转向人工智能和深度学习的各种应用 , 比如自动驾驶汽车、医疗保健、高性能计算、和深度学习等 。
今年秋季场黄仁勋在主题演讲里强调了对Omniverse的未来期待 , 他透露:英伟达将建立一个E-2(Earth Two , 地球二号) , 这是一个地球数字孪生模型 , 目的是模拟和预测长期的气候变化 。
【数据|黄仁勋GTC演讲速递:元宇宙构建工具本质上是“数字虫洞”】从Facebook改名“Meta” , 到微软把混合现实(MR)平台融入到视频会议工具Teams中 , 英伟达似乎也是在铆足了力布局“元宇宙” 。

推荐阅读