理想AI Talk第二季上线,最新推出的VLA视觉模型备受关注,该模型具备强大的图像生成能力,能够更准确地识别和理解图像内容,其核心技术包括深度学习、计算机视觉等领域的前沿研究,为人工智能领域的发展注入了新的活力,该模型的推出将有助于推动人工智能技术的进一步普及和应用,为各行各业提供更高效、更智能的解决方案,摘要字数控制在100-200字左右。
理想汽车在“理想AI Talk第二季”技术发布会上重点介绍了其最新研发成果——VLA司机大模型系统,这一技术被明确定义为面向交通领域的专业生产工具,致力于实现接近人类司机水平的自动驾驶功能,此次发布会简化而全面地展示了理想汽车在AI领域的发展方向和思路。
- 2021-2022年:基于规则算法与高精地图的辅助驾驶系统初步实施。
- 2023-2024年:过渡到端到端架构结合视觉语言模型(VLM)的辅助驾驶系统,展现了更高级别的智能化。
- 2025年:推出具备多模态感知与决策能力的VLA(视觉语言行动)司机大模型,实现重大技术突破。
VLA系统的技术架构揭示了其独特之处:采用三阶段训练机制,包括预训练、后训练、强化训练三个阶段,在安全性验证方面,研发团队致力于组建专业安全团队、构建全面的交通世界模型,并累计完成超千万公里的虚拟仿真测试,确保技术的安全性和可靠性。
在硬件适配方面,技术团队通过自研推理引擎实现了与硬件的完美结合,使用INT4量化技术使Orin-X芯片支持语言模型运算,而Thor-U芯片与双Orin-X芯片的协同工作则保证了算力的均衡分配。
在模型研发过程中,理想汽车充分利用DeepSeek开源框架来缩短研发周期,并投入超过行业平均水平的计算资源进行基座训练,企业积极向开源社区贡献自研车载操作系统代码,展现了其开放合作的态度。
在媒体问答环节,理想汽车董事长李想就技术发展提出了独到观点,他认为自动驾驶系统的智能程度应以能否承担完整驾驶任务为评判标准,并指出当前行业正由辅助工具阶段向生产工具阶段演进,需突破多模态协同与价值对齐两大技术瓶颈,他还透露了企业的发展战略,包括研发投入的持续增长、技术团队规模的扩大以及开源工具链LISA 2.0的发布计划。
值得注意的是,我国L2+级自动驾驶渗透率已达62%,但专业生产工具级系统尚处于验证阶段,行业专家指出,视觉大模型与行动策略的协同优化、长尾场景应对能力、系统可解释性等关键技术仍是行业需要持续突破的重点,理想汽车在这一领域的发展备受关注,其技术进步对于整个行业来说具有重要意义。