近日,德国萨尔大学和马克斯·普朗克信息学研究所的研究人员已经加入英特尔,以使用不完整的3D扫描数据来改进数字3D对象创建。“VConv-DAE”是一种卷积体积自动编码器,可以从噪声数据中学习体积表示。
3D扫描具有广泛的应用范围,从汽车和航空航天部门的逆向工程,到采集定制足部矫形器的解剖数据,简单地制作3D打印模型。
但是让不完整或扭曲的3D扫描生成的数据可能是无效的。这不是偶然的事情:不正确的照明、3D扫描期间的移动以及各种其他因素可能导致生成的3D模型具有严重的问题。
解决这些问题的最好办法当然是通过投资适当的照明设备、稳定的旋转盘和各种其他工具来消除这些问题。但是当这些选项不可用时,必须探索其他路线。
一个潜在的路线刚刚由一个多技术和广泛采购的研究人员开发,由来自计算巨头英特尔和两个德国研究机构的代表组成:在慕尼黑的马克斯·普朗克信息学研究所和在萨尔布吕肯的萨尔州大学。
这个多学科团队一起开发了VConv-DAE,一种深体积形状学习编码器,通过估计体素占用网格来学习嘈杂数据的体积表示。
研究人员说,该工具非常适用于在3D扫描应用中可能出现的“挑战性任务,如去噪和形状完成”。
“尽管3D扫描技术近年来取得了重大进展,但数字和自动捕获真实物体的几何形状仍然是一个挑战,”马克斯·普朗克信息学研究所的“可扩展学习和感知”组织的领导者Mario Fritz说道。
Fritz所说的那种3D扫描设备并不一定是高端设备,而是像微软Kinect这样的运动感应输入设备,它通常用于微软Xbox游戏机上的视频游戏。Kinect硬件的一个缺点是无法准确识别各种纹理。这意味着太反射、斑驳或其他难以辨别的曲面可能会导致3D数据不准确,这可能会影响3D打印。
“由此产生的有缺陷或甚至不完整的三维几何形状对于一系列应用程序构成了一个真正的问题,例如在虚拟或增强现实中,与机器人或3D打印一起工作,”Fritz说。
为了解决这些问题,新开发的VConv-DAE工具使用特殊的深度学习神经网络从不完整的数据集中生成3D模型。
根据研究人员的说法,编码器成功的秘诀在于避免使用标签分配每个对象的直观错误:“培训以及由此产生的代表性与对象标签的概念有着强烈和不必要的联系,”他们说,他们的体素占用网格估计方法工作非常好。
有趣的是,新技术提供了“用于分类的竞争性能”,同时也为形状插值提供了有希望的结果。
最终,这可能有助于新一代的3D扫描工具,允许像Kinect这样的简单硬件生成高精度的3D数据,而不会丢失任何信息。
就职于萨尔大学计算机图形学教授和德国人工智能研究中心(DFKI)的Philipp Slusallek说,“将来必须能够快速捕捉现实世界中的物体,并以现实的方式将其投射到数字世界中。”
Slusallek是欧洲联合研究项目“分布式3D对象设计”(DISPORO)的领先人物。DISTRO是一个将欧洲视觉计算和3D计算机图形领先实验室联合在一起的网络,目的是在分布式3D对象设计、定制和制作领域培养新一代科学家、技术人员和企业家。
716 0
登陆后参与评论
2024-11-04 13:27:47
2024-09-30 14:02:02
2024-09-30 13:55:36
2024-09-23 13:01:49
2024-09-23 12:46:35
2024-09-09 11:14:31
2024-09-03 15:03:59
2024-09-03 14:58:48
2024-08-26 10:28:31
2024-08-12 10:39:48
2024-08-12 10:35:25
2024-08-08 12:08:05