您当前位置:首页 > 理财

新视角合成这方面的大牛是近两年大火的NeRF

来源:TechWeb   阅读量:19532   
时间: 2021-12-27 11:23

万万没想到,把照片变3D这件事,离了神经网络也是这般丝滑。

新视角合成这方面的大牛是近两年大火的NeRF

而在此之前,新视角合成这方面的大牛,是近两年大火的NeRF。

它是一个简单的全连接神经网络,使用2D图像的信息作为训练数据,还原拥有体积的3D场景。

但最近,来自伯克利大学的研究人员提出了一个叫做Plenoxels的方法。

不需要神经网络,仅仅通过梯度下降和正则化便实现了同样的效果,而且速度还快了100倍!

那么他们是如何做到这点的呢。

由NeRF到Plenoxels的进化

为了帮助大家理解Plenoxels,我们先来简单介绍一下NeRF模型。

要准备NeRF的数据,我们首先需要一部相机。

我们从图上可以看到,射线上的点有了颜色,每点的颜色c = 和密度就是输出向量。

接着NeRF使用体积渲染技术将得到的颜色与密度进行3D渲染。

由于渲染函数是可导的,我们可以最小化合成效果与实际效果的误差,从而进行神经网络参数的优化。

其中mlp使用的参数多可达到5MB,实际训练起来就会发现训练时间十分漫长,通常要1—4天。

这个速度与Plenoxels的11分钟相比确实是无法接受的。

Plenoxels发现NeRF成功的秘诀其实是它的体积渲染方程,与其最耗时的神经网络关系不大。

那么你一定会好奇这个体积渲染方程究竟是何方神圣,我们就先来看一下。

sigma,i代表不透明度,ci代表颜色,delta,i代表距离Ti代表有多少光经过射线上的点i,是通过密度和距离计算的

这个体积渲染方程其实就是将射线上每个点的颜色,不透明度,光,还有距离进行了一个整合处理。

Plenoxels首先重建了一个稀疏的体素表格,每个被占用的体素都带有不透明度和球谐系数。

我们的颜色信息就存储在这些球谐系数中,每个颜色通道需要9个系数表示,一共有三个颜色,那么每个体素就需要27个球谐系数来表示它的颜色。

相机射线经过的每个点的颜色和不透明度,就是通过其最近处的8个体素的三线性插值计算的。

接着与NeRF一样,使用体积渲染技术将得到的颜色与不透明度进行3D渲染。

Plenoxels通过对渲染的像素的平均平方误差进行最小化,来优化体素的不透明度和球谐系数,并且使用TV正则化帮助消除噪声。

我们可以看出,是否使用TV正则化的效果区别还是很大的!

提速100倍,仅需11分钟

我们用最直观的方法对比一下两个模型速度上的差距。

看到了吗,只用几秒Plenoxels就可以达到一个比较清晰的效果,而NeRF只有一个模糊的影子。

同样是单个场景,NeRF使用型号为v100的单个GPU训练需要耗时1—2天,而Plenoxels使用单个GPU通常只需要11分钟。

这时有一个问题一定萦绕在你的脑海里,速度提升了这么多,效果真的不会受影响吗。

空口无凭,我们还是要用数据说话。

PSNR:是最普遍,最广泛使用的评鉴画质的客观量测法,PSNR值越大,就代表失真越少。

SSIM:衡量实际图像和合成图像的相似度,当两张图像一模一样时,SSIM的值等于1。。

可以看到Plenoxels对比其他模型的表现不说样样最好,但也绝不落后他人,关键在于它的速度整整快了两个数量级!

正因为Plenoxels速度上的大幅提升,使得一些目前处于瓶颈的下游应用变得可能,例如多次反射照明和大型场景的3D建模。

如果能在相机和体素散列上进行有效优化,模型甚至可以让端到端三维重建成为拥有pipeline的实际应用。

相信Plenoxels的潜力不仅于此,让我们一起期待它落地后的成果吧!

UC伯克利本科生一作

效果强劲的Plenoxels来自UC伯克利的学生团队,一作Alex Yu还是一名本科生。

在大学里,他不仅同时学习计算机和应用数学两门专业,还在伯克利的BAIR实验室进行3D计算机视觉的相关研究。9月17日上午,在海南海口举行的2021世界新能源汽车大会上,特斯拉CEO埃隆马斯克在视频演讲中表示,未来的自动驾驶可以通过视觉神经网络实现,比普通人安全十几倍。

Alex计划在2022的秋季开始他的PhD旅程,让人不禁感叹AI界真是人才辈出。

在未来经过PhD的学习后,他又会迸发出怎样的能量呢,让我们一起拭目以待吧!

GitHub代码开源

目前,Plenoxels项目的代码已经在GitHub上开源。

小伙伴们要注意的是,拍摄照片的时候要尽可能环绕物体,并且尝试不同的高度哦。

快来试试效果如何吧!

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

金融聚焦

 炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 中信证券发布研究报告称,市场对锂价过快上涨以及锂供应不足的担忧导致锂板块出现显著

2021-12-27 11:23

 根据疾控等部门流调情况,现将12月25日0时—24时西安市新增的155例确诊病例的公共场所活动轨迹公布如下。 10月17日12:16,到东方盛世花园小区北

2021-12-27 11:23

 游艇界劳斯莱斯要IPO了!背后竟是这家山东企业… 豪华游艇是财富和身份的象征,但能拥有的人凤毛麟角,因此多年来一直为大众谈论和好奇一些家族办公室从业者称,

2021-12-27 11:23

 上周五刚刚收获20CM涨停,10月25日早盘,国科微再度上演20CM涨停。 基本面上,前三季度公司净利润炸裂式增长119倍,第三季度利润再创新高机构表示,三季

2021-12-27 11:23

 据SAMMOBILE报道,全世界的三星粉丝都在等待OneUI4.0的更新三星尚未发布基于安卓12的更新可是,OneUI4.0的Beta测试已经进行了一段时间

2021-12-27 11:23

 根据本站网友Meizi_的投稿,苹果今天推送了官方版watchOS8.1,这是9月推出的watchOS8操作系统的首次重大更新。 WatchOS8.1与A

2021-12-27 11:23

 今日A股三大股指开盘涨跌不一,沪指低开后逐步震荡上行,而创业板指高开后,先是震荡整固,随后企稳拉升,延续强势格局从盘面上来看,轻指数重个股行情再现,电力,储能,

2021-12-27 11:23

 L0phtCrack是一款密码破解工具,可用于检测Windows和UNIX用户是否使用了不安全的密码,并支持通过字典和蛮力破解恢复丢失的Windows密码。

2021-12-27 11:23

 据优惠券中国新闻社报道,今天市场上贴出了比亚迪电池涨价的联系函。 从信中可以看出,由于综合成本大幅提升,比亚迪决定将CO8M等电池产品单价上调:元。 与

2021-12-27 11:23

 根据消息显示,前三季度煤炭市场运行特征如下: 煤炭产量稳步增长前三季度,各方扎实推进增产保煤重点煤炭企业在确保安全的前提下,全力以赴挖潜增产,相关部门加快

2021-12-27 11:23

 ,高通今日宣布推出4款具备性能升级,5G连接等功能的全新中端处理器,分别为:骁龙778GPlus5G,6955G,480Plus5G和6804G。 根据高

2021-12-27 11:23

 打新的肉是否还能放心吃。 日前,科创板N凯尔达,创业板N可孚上市首日双双破发,凯尔达低开4.9%,可孚医疗低开10.89%截止中午收盘,N可孚下跌6.96

2021-12-27 11:23

 日前,第26届中国五金博览会在中国五金之都——浙江永康开幕本届博览会首次设立了800平方米的世界五金精品展区,吸引了来自中国20多个省市及美国,德国,西班牙等国

2021-12-27 11:23

 据外媒TechPowerRUP报道,希捷今天发布了三款《星球大战》联名硬盘,均采用曼达洛人贝斯卡贝斯卡的金属质感,并全部印有《星球大战》的银河帝国徽章这三款产品

2021-12-27 11:23

 当前我国数字经济加速发展,存储的发展正是增加数字经济发展的需要,也是提升数字产业技术实力的重要组成部分。 中方官员明确提出,要推动数字经济与实体经济融合,

2021-12-27 11:23

 资本市场号称金眼银牙,被称为牙草的通策医疗总市值一度突破千亿元,引发投资者对牙科赛道的密切关注。 今年以来,与通策医疗同轨的瑞尔集团和中国口腔医疗集团开始在香

2021-12-27 11:23

 ,据力学研究所,最近几天,中国科学院力学研究所研究员苏业旺团队设计并制备出无接触电阻式柔性大应变传感器。 据介绍,该传感器包含一个偏轴蛇形叠层结构和两层弹

2021-12-27 11:23

 年底估值切换窗口期间,前期涨幅较小的低估值蓝筹股有望补涨。 截至今年9月底,由去年公募赢家赵毅管理的农行新能源主题管理规模达到259亿元仅第三季度,净增长率就

2021-12-27 11:23

 炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 盘点一周市场热点,掘金后市板块机会。 延续上周的颓势,本周A股三大指数持续下跌

2021-12-27 11:23

 日前,北京市住建委,市规自委联合印发《北京市共有产权住房规划设计宜居建设导则》,对2017年发布的《北京市共有产权住房规划设计宜居建设导则》进行了11项修订。

2021-12-27 11:23

市场金融网
关注我们
foota footb footc footd foote footf