自动驾驶是人工智能的绝佳应用场景之一,近年来随着智能网联新能源汽车的快速普及,以及政策的持续大力支持,自动驾驶技术也迎来高速发展的机遇。
另一方面,如何应对复杂的城市驾驶场景以及一些长尾罕见事件依然是自动驾驶技术实现商业化应用所必须面对的挑战。
在3月7日召开的第一财经“科创未来行”年度首场产业沙龙上,商汤绝影智能云研发总经理武伟展示了全新的自动驾驶研发路径,他表示,DeepSeek–R1基于纯强化学习领域的关键创新,给自动驾驶技术的发展带来了很大的启发,商汤绝影也在打造全新的技术范式,有望极大程度突破现有瓶颈。
据武伟介绍,特斯拉以及一些国内自动驾驶领域的头部企业,目前都是以数据驱动的方式,依靠海量的人类驾驶数据训练端到端大模型,本质还是对人类驾驶行为的模仿学习,而这种以模仿学习为主的端到端自动驾驶就会面临很大的挑战。
“模仿学习对数据的质和量都有着非常高的要求,”武伟认为,特斯拉的自动驾驶性能突出是因为其上路车辆已达到百万量级,国内任何一个厂商都还没达到这一数据量级。另一方面,即使数据量上可以满足需求,仅仅依靠模仿学习的端到端大模型依然只能做到无限接近人类驾驶行为而很难突破人类的能力上限,导致出现性能瓶颈。
DeepSeek出现让自动驾驶技术打破这一瓶颈成为可能,“DeepSeek的技术范式验证了纯粹的强化学习可以带来很长的思维链的涌现,而这一思维范式将大幅降低数据门槛,”武伟表示,在强化学习阶段,DeepSeek所用的数据量比模仿学习低了一两个数量级,并且有一个非常好的尺度定律(Scaling law),能够带来性能上突破人类极限的希望。
2024年底,商汤绝影推出首个可用于行业生产的世界模型——开悟世界模型。武伟介绍称,这一世界模型的核心能力是用于自动驾驶的训练数据的生成,同时构建闭环仿真的训练和测试的环境,通过在云端进行自动驾驶的闭环训练,为强化学习的训练构建良好基础。
目前,开悟世界模型已能够生成1024类数据和千万量级的场景库,武伟表示,这些数据将于今年向行业开放。
“通过世界模型和端到端算法进行交互,在闭环仿真环境中构建主车端到端自动驾驶和他车环境之间的自主博弈,自动驾驶算法就可以脱离人类行为模式进行自主强化学习,实现交互能力的提升。”武伟表示。
今年2月,商汤绝影还推出了行业首个“与世界模型协同交互的端到端自动驾驶路线R-UniAD”。武伟表示,这一自动驾驶的全新研发路线正是一定程度借鉴了上述DeepSeek的思维范式。
据他介绍,R-UniAD方案具体分为端到端模仿学习、依托世界模型进行云端强化学习训练以及从云端到车端的蒸馏部署三个阶段。“我们希望通过这一套范式,大大降低自动驾驶研发的数据成本和项目定制化的开发成本,真正让商汤绝影成为自动驾驶领域的DeepSeek。”
“我们希望加速智能汽车驶入通用人工智能的时代,这是绝影的愿景。”武伟说。
帮企客致力于为您提供最新最全的财经资讯,想了解更多行业动态,欢迎关注本站。免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com