近日,自动驾驶领域的巨头Waymo公布了其最新的研究成果——“端到端多模态自动驾驶模型”(End-to-End Multimodal Autonomous Driving Model,简称EMMA)。这一新模型是基于谷歌的先进多模态大语言模型Gemini而开发的,旨在推动无人驾驶车辆在复杂多变的环境中实现更加智能和高效的导航。
传统的自动驾驶系统往往采用分模块化的设计思路,将感知、映射、预测和规划等功能分别进行开发。然而,这种设计方式在系统的扩展性和对新环境的适应性上存在明显的局限性。为了突破这些限制,Waymo的研究团队选择了与谷歌的Gemini模型进行合作。Gemini作为一款经过大量互联网数据训练的多模态大语言模型,不仅积累了丰富的世界知识,还能通过链式推理等技术模拟人类的思维方式,从而有效应对各种复杂的驾驶任务。
EMMA模型的推出,标志着Waymo在自动驾驶领域迈出了重要的一步。然而,这一新模型在实际应用中还面临着一些挑战。由于计算成本高昂,EMMA目前还无法处理来自激光雷达或雷达的3D传感器输入,仅能处理有限数量的图像帧。这意味着,在现阶段,EMMA的感知能力还受到一定的限制。
此外,研究人员也指出,像Gemini这样的多模态大语言模型有时会产生不准确的“幻觉”。在无人驾驶领域,对错误的容忍度极低,任何微小的偏差都可能导致严重的后果。因此,在这些模型能够广泛应用于实际车辆之前,还需要进行更深入的研究和严格的测试,以确保其准确性和可靠性。
尽管面临诸多挑战,但Waymo与谷歌Gemini的合作无疑为自动驾驶领域带来了新的希望和机遇。随着技术的不断进步和研究的深入,我们有理由相信,未来的无人驾驶车辆将更加智能、高效和安全,为人们的出行带来更加便捷和舒适的体验。
以上就是本次分享的全部精彩内容了,极8网,您的网络资讯宝库,汇聚海量信息,每日更新不断,无论您是对科技新知感兴趣,还是热衷于追踪娱乐热点,这里都能满足您的需求。
版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。