盖世汽车获悉 日前,小米汽车正式推出Xiaomi Auto World Model全新框架,将三维重建与视频生成进行深度耦合。与传统“重建+生成”简单串联的路径不同,该框架让两者在结构上互相约束:重建侧提供几何锚点,为生成“打地基”;生成侧补全未观测区域,为重建“扩边界”,共同抑制长时序漂移。
世界模型被视为辅助驾驶的“大脑预演系统”,能够基于历史与当前观测,预测环境下一步演化,帮助车辆应对暴雨、落石、逆行等低概率高危场景。此前行业两条主流路线——重建与生成(能预测但易漂移)——各自存在短板。小米的一体化架构尝试将两者优势融合。
在技术实现上,重建模块WorldRec采用稀疏三维锚点表征,替代传统逐像素稠密高斯方法,通过多视角多时刻特征聚合与可见性加权融合,实现10秒视频重建仅需10秒。生成模块WorldGen经两阶段训练,仅需4步去噪、0.19秒生成一帧,支持最长1分钟视频,可模拟罕见动物闯入、极端天气等长尾场景。
据小米公布,该框架在Waymo、nuScenes等主流基准测试中全面取得SOTA。其中WorldRec在Waymo数据集上PSNR达28.48,超出此前最佳方法;WorldGen在nuScenes上FVD达64.97,单视角生成速度较同类自回归方法快约5.6倍。
目前该框架已在小米汽车三大场景落地:合成数据生成、仿真测试(闭环复现真实事故)、辅助驾驶学堂(已上线全车型实景模拟功能)。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
九个“第一”改变采购行业京东企业业务按下企业成长
在数字经济范式下,数字技术对于企业经营管理的改变无处不在从数据决...
4月香港零售业总销货价值临时估计为347亿港元同
智通财经APP获悉,6月1日,香港政府统计处发表最新的零售业销货...
拉卡拉新战略重点:以数字支付为切入点致力于释放支
5月24日,拉卡拉在北京召开了主题为“共建共享数字未来”的202...
传言称VR节奏游戏《节奏光剑》或将登陆苹果首款M
,据外媒报道,有传言称,苹果将与一些游戏开发商合作,为其首款混合...
“童心洋溢浪漫奔涌”中国太保寿险成功举办首届客户
5月28日,中国太保旗下中国太保寿险首届客户节线下欢享仪式在上海...
百家湖西花园业主遇急新物业世茂管家彻夜陪伴
ldquo;管家你好!我家门口一直有敲门声,怎么办呀!rdquo...