静态照片生成体积视频 当虹科技与咪咕联合发布跨模态AIGC产品 观察
(资料图片仅供参考)
在3月30日举办的第十届中国网络视听大会上,当虹科技与中国移动咪咕公司联合发布跨模态AIGC(人工智能生产内容)产品,以静态照片生成三维体积视频。
“不同模态之间相互转化,可以把现实世界中的任何物体‘搬进’元宇宙世界。”当虹科技副总裁叶建华向上证报记者介绍,与平面视频不同,体积视频可以让用户在任何位置、任何方向自由地观看,更具立体感、沉浸感和交互性,可应用于体育赛事、大型综艺6DOF(六自由度)直点播,以及出行元宇宙等场景。
随着人工智能的应用场景愈发宽广,针对平面视频的AIGC也在加速落地。其中,三维体积视频被认为是AIGC未来发展的重要方向之一。不过相较二维视频而言,体积视频仍具有门槛较高、数据量巨大等两大痛点。按照传统方法,采集体积视频需要架设几十台、甚至上百台工业摄像机,不仅采集成本高,且对采集环境、采集技能都有较高要求。
“对症破题”,据了解,此次当虹科技与咪咕联合发布的跨模态AIGC产品,通过少量静态照片即能生成体积视频,大大降低了采集门槛;同时,通过点云模型转换及压缩算法,可实现800倍视觉无损压缩,解决了体积视频的传输难题。
“提到体积视频,很多人会联想到VR360°全景视频,必须借助头显设备才能观看。” 叶建华告诉记者,“其实不然。它可以实现多类型终端适配,我们仅凭裸眼就能与普通屏幕里的内容交互,因此具有广阔的商业应用前景。”
“体积视频也将给出行元宇宙带来深刻变革。”叶建华进一步表示,如通过体积视频技术,结合车内氛围灯、香氛、座椅、空调等硬件,能满足多场景娱乐需求;联动XR(扩展现实)设备,体积视频技术可以创建一个虚拟影院,使不同参与者在同一个场景内进行多模态互动;通过跟踪驾驶员的头部和手部动作,仿真模拟危险驾驶场景,体积视频技术还可以提供更准确的驾驶辅助。
标签: