全息图像可以提供物体的三维(3D)视觉效果,比二维(2D)图像更加真实和立体,在医学成像、制造业、虚拟现实等多个领域都有着巨大的价值。
全息技术迎来突破:深度学习可将二维图像转换为三维图像© 由 IT之家 提供
IT之家注意到,传统的全息技术需要记录物体的三维数据和与光线的相互作用,这个过程需要很高的计算能力和专门的摄像机来拍摄三维图像,这种复杂性限制了全息图像的广泛应用。
近年来,也有许多基于深度学习的方法被提出,用来生成全息图像。它们可以直接从使用 RGB-D 摄像机拍摄的三维数据中创建全息图像,RGB-D 摄像机可以同时获取物体的颜色和深度信息。这种方法避免了传统方法中的许多计算挑战,是一种更简单的生成全息图像的方法。
现在,日本千叶大学工程研究院的下馬智之教授带领的研究团队提出了一种基于深度学习的新方法,进一步简化了全息图像的生成过程,可以直接从普通摄像机拍摄的二维彩色图像中生成三维场景或物体。这项研究最近发表在《光学与激光工程(Optics and Lasers in Engineering)》杂志上。千叶大学工程研究院的石井佳之和伊藤智之也参与了这项研究。
谈到这项研究背后的动机,下馬教授说:“实现全息显示有几个难题,包括三维数据的获取、全息图像的计算成本以及全息图像与全息显示设备特性之间的转换。我们进行这项研究是因为我们相信深度学习近年来发展迅速,有潜力解决这些问题。”
该方法使用三个深度神经网络(DNN)将普通二维彩色图像转换为可以用来显示三维场景或物体的全息图像。第一个 DNN 使用普通摄像机拍摄的彩色图像作为输入,然后预测相关的深度图,提供关于图像三维结构的信息。第一个 DNN 生成的原始 RGB 图像和深度图都被第二个 DNN 用来生成全息图像。最后,第三个 DNN 对第二个 DNN 生成的全息图像进行优化,使其适合在不同设备上显示。
研究人员发现,该方法处理数据和生成全息图像所花费的时间优于最先进的图形处理单元。“我们方法另一个好处是,最终全息图像重现出来的图片可以呈现出自然而真实的三维效果。而且,在生成全息图像时不需要使用深度信息,因此这种方法成本低廉,不需要使用 RGB-D 摄像机等三维成像设备。”下馬教授在进一步讨论结果时补充道。
在不久的将来,这种方法可以在头戴式显示器中找到潜在的应用,为生成高保真的三维显示提供帮助。同样,也可能革新车载全息显示器,以三维的方式展示行人、道路和标志等必要信息,该方法有望为推动全息技术的普及和发展铺平道路。
访谈
更多做行业赋能者 HID迎接数字化浪潮新机遇 破解新挑战
今年3月份,全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》(以下简称“报告”),该报告…
数字化浪潮下,安防厂商如何满足行业客户的定制化需求?
回顾近两年,受疫情因素影响,包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击,市场…
博思高邓绍昌:乘产品创新及客户服务之舟,在市场变革中逆风飞扬
11月24日,由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会,在深…