晓查 发自 凹非寺
量子位 报道 | 公众号 QbitAI
爱自拍的女生 , 为了拍一张美照总是需要很久 , 就是为了找到最美的角度 。
比如这位妹子 , 在自己的书架前拍了4张自拍照 , 都不太满意 。
文章图片
现在可以把选最美角度这件事交给AI了 , 让妹子不再苦恼 。 只要几张照片 , 它能从中生成各种角度的自拍 。
文章图片
然后 , 你可以在AI生成的视频里 , 找到一个自认为最美的角度 , 分享到朋友圈 。
这个AI就是华盛顿大学和谷歌联合开发的nerfies 。
这种方法不需要太复杂的设备 , 只要智能手机的摄像头和CPU就能完成运算和渲染 。 这可比iPhone 12 Pro用内置激光雷达来生成3D图像的成本低多了 。
文章图片
原理
看到nerfies这个名字是不是有种似曾相识的感觉?nerfies其实就是NeRF+Selfies两个单词合并而来 。
NeRF(神经辐射场)是谷歌最近开发的一种2D图像转3D的模型 , 但NeRF要求拍摄对象在整个过程保持完全静止 。
比如 , 上面的妹子在自拍4张照片的时候 , 头部姿势不可避免地会发生变化 , 如果直接套用NeRF , 效果惨不忍睹 。
文章图片
而nerfies则是可变性神经辐射场(Deformable NeRF) , 它能够重建非刚性变形的场景 。
在NeRF的基础上 , 作者从几何和物理模拟的原理出发 , 提出了NeRF的弹性正则化 , 进一步提高了2D转3D的鲁棒性 。
在可变性NeRF中 , 作者引入了弹性正则化、背景正则化以及一种可避免不良的局部最小值退火技术 。
【可变性|这个AI能帮你女朋友自拍:从照片生成3D视频,总有个角度让她满意】
文章图片
作者将潜在变形码(ω)和外观码(ψ)与每个图像关联 。 在观测帧中对摄像机光线进行追踪 , 并使用变形场将样本沿光线转换到规范帧 , 变形场由变形码ω编码为MLP 。
另外使用转换后的样本位置(x0 , y0 , z0)、观察方向(θ , φ)和外观码ψ作为MLP的输入 , 来查询模板NeRF模块 , 并沿着光线对样本进行积分 。
更多玩法
可变性NeRF不仅可以用于自拍 , 还有更多好玩的用途 。
比如创建“希区柯克变焦”的效果 , 过去需要专门的摄影技巧 , 或者是通过由远及近的拍摄视频再后期处理 。 现在只要几张照片就可以了 。
文章图片
如果不需要场景角度变化 , 而是需要人物姿势变化呢?
可变性NeRF能在头向左和向右之间线性插入任意姿势的照片 。
文章图片
最后还有一个用途是生成防抖视频 。 既然可变性NeRF可以生成任意角度的图像 , 那么现在可以让手负责抖 , 而让它负责稳了 。
文章图片
目前作者还没有公布源代码 , 不过他们的项目主页上已经放上了GitHub的按钮 , 看来他们已经准备开源了 。 你是不是迫不及待想试一下呢?
项目地址:
https://nerfies.github.io/
论文地址:
https://arxiv.org/abs/2011.12948
— 完 —
本文系网易新闻?网易号特色内容激励计划签约账号【量子位】原创内容 , 未经账号授权 , 禁止随意转载 。
_原题《这个AI能帮你女朋友自拍:从照片生成3D视频 , 总有个角度让她满意》
阅读原文
推荐阅读
- 功能|小米 Watch S1图赏:商务气质新系列,稳步入场不急切
- 快报|“他,是能成就导师的学生”
- 智能化|适老化服务让银行更有温度
- bleu|字节跳动火山翻译上新 38 个稀有语种,翻译能力再升级
- 市场|激斗智能家居,大厂遇到新对手
- 硬件|汽车之家年底裁员,员工称多个职能部门已被撤销
- 公司|科思科技:正在加速推进智能无线电基带处理芯片的研发
- 功能|Linux 微信官方版 2.1.1 正式发布
- 网络化|工信部:2025年建成500个以上智能制造示范工厂
- 识别|沈阳地铁重大变化!能摘口罩吗?