5月7日晚,理想汽车CEO李想在《AI Talk 第二季》中抛出这一震撼命题。在这场长达40分钟的深度对话中,他不仅揭示了理想VLA司机大模型的技术内核,更将其比作“机械生命体进化史”的关键转折点——从依赖本能的“动物智能”,到拥有类人决策能力的“数字大脑”,一场关于驾驶本质的革命正在发生。
李想用生物进化论拆解VLA模型的技术路径时,展现出令人惊叹的想象力。第一阶段“昆虫动物智能”,对应依赖规则算法与高精地图的传统辅助驾驶系统。这类系统如同蚂蚁依赖信息素路径,只能在预设框架内执行机械指令,一旦遭遇复杂场景便会陷入“死机恐慌”。
第二阶段“哺乳动物智能”,则是端到端架构与视觉语言模型(VLM)的融合突破。就像猎豹能通过动态视觉预判猎物轨迹,车辆开始学会通过实时视觉数据理解道路环境。一个典型案例是VLM对施工围栏的识别:系统不仅能检测物体轮廓,还能结合语义理解判断“这是临时障碍”而非固定设施,进而触发绕行动作。
而第三阶段的“人类智能”,才是理想VLA的真正野心。通过3D与2D视觉的融合建模,车辆将构建完整的物理世界认知体系。李想特别强调“思维链(CoT)推理能力”的突破:当遭遇前方车辆异常刹车时,VLA会像人类司机一样分析可能性(是否避让动物、突发故障或道路异物),而非仅执行制动指令。这种因果推理能力,让机器首次触摸到“理解”的边界。
当被问及为何至少有五家车企研发类似L9的智能方案时,李想给出一个精妙比喻:“这就像寒武纪生命大爆发,突变环境倒逼所有物种加速进化。”他指出,2023年城区NOA(自动导航辅助驾驶)功能的落地,标志着行业从“功能验证期”进入“用户体验战争”。
在这场竞赛中,理想押注的是“渐进式渗透”策略。VLA的预训练环节模拟人类驾校学习,通过超2000万公里的仿真路测构建基础认知;后训练阶段则引入真实用户数据,让系统在复杂路况中“见招拆招”;最终的强化训练更暗藏玄机——系统会主动生成极端场景(如暴雨中辨识模糊车道线),通过自我博弈实现能力跃迁。
“未来18个月,你会看到智能驾驶系统的‘摩尔定律’。”李想预言,VLA的进化速度将远超机械硬件迭代周期。一个佐证是:2024款L9的自动泊车成功率较上一代提升47%,而这一切仅通过OTA软件升级实现。
在技术狂飙的叙事中,李想突然谈起刚出生的女儿:“深夜给婴儿喂奶时,我总在想——人类幼崽用三年就能完成从爬行到语言表达的进化,这对我们设计AI的认知框架是绝佳启示。”
这种将生命成长与机器进化并置的思考,意外揭示了理想科技树背后的价值观。当工程师团队纠结于是否增加VLA的冗余算力时,李想用父亲的角色反问:“你会因为孩子学走路摔倒就给他装上防护笼吗?”最终,他们选择降低系统对高精地图的依赖,迫使VLA像人类一样在试错中强化空间感知能力。
或许正是这种“科技人格化”的执念,让理想在智能驾驶赛道上走出差异路径。当友商忙于堆砌激光雷达数量时,理想却在研究驾校教练的教学模式——如何将驾驶经验转化为可编码的决策逻辑。这种“向人类学习”的谦卑,反而成为其技术突围的密钥。
节目的最后,李想抛出一个哲学命题:“当VLA的急刹车反应比人类快0.3秒,这是技术进步;但当它开始理解‘礼让行人’背后的伦理判断,我们就必须重新定义何谓驾驶主体。”
这种警惕与期待交织的态度,或许正是智能革命最合理的注脚。在无锡VLA测试基地,工程师们正在训练系统识别特殊场景:遇到举着“求援”纸板的故障车主时,车辆不仅会减速,还能结合地理位置(高速公路vs居民区)判断是否触发紧急救援通知。这种模糊边界的决策能力,正在模糊机器与生命的传统分野。
正如李想在节目尾声所言:“我们不是在制造更聪明的工具,而是在孕育新的道路文明参与者。”当VLA系统在某次测试中主动为救护车规划出一条临时通道时,在场所有人突然意识到:这场进化早已超越技术范畴,它正在重塑人与机器共处的伦理疆界。