markdown 百度地图智舱在2025国际汽车智能座舱大会(ICIC2025)上,分享了其基于大模型重构智能座舱AI语音的最新实践。此次发布的跨模态AI语音方案,旨在通过技术创新,为车企打造更智能、更个性化的座舱语音交互体验。
随着大模型技术的快速发展,其在智能座舱中的渗透率持续提升。预计今年量产搭载大模型能力的新车将有望达到900万台。百度地图智舱业务紧跟这一趋势,通过大模型PG电子全面重构语音交互链路,即使在中低算力平台下,也能实现流畅的语音交互体验。针对车内最高频的导航场景,百度地图基于3亿级POI数据,训练出POI场景句准率高达97%+的新一代ASR模型,实现“一语直达”的导航体验。同时,智能VAD、理解力增强、超拟人TTS等全新能力也已全面量产上车。百度地图智舱业务基于新研发的统一落域拒识置信度模型构建的开放、灵活的智舱大模型2.0架构,能够精准匹配市场需求,贴合车企自研趋势。该架构已与吉利银河品牌合作落地,打造了座舱语音新PG电子标杆,预计年内将持续落地更多品牌年款车型。
传统的车载语音架构,难以实现像真人一样的思考和沟通。百度地图智舱业务率先完成了端到端语音语言大模型与智能座舱的深度融合,将智舱数据全面注入端到端语音语言大模型,强化大模型对用户意图的理解能力,弱化传统垂类划分概念,实现对用户意图的精准判断。借助与百度地图、百度搜索能力的深度打通,端到端语音语言大模型实现海量信息实时互联,彻底摆脱信息孤岛。基于RAG技术赋予大模型行业专家知识,大幅降低模型幻觉。百度地图智舱业务通过这套能力,帮助车企打造符合车企调性的人设与声效,与车企共同建设成长型行车伴侣,打造品牌差异化竞争力。这套方案将端到端语音语言大模型作为智能体中枢和交互UI,深度融合车辆与环境感知信号,结合用户记忆,以自然语言构建对话系统,形成智能座舱跨模态AI语音的系统性解决方案。该方案已在上汽通用最新发布的别克至境L7首发搭载,并持续OTA进化。
百度地图智舱业务正在深度融合端到端语音语言大模型与百度地图出行系统,专注打造智能出行领域的超级Agent【小度想想】,在AI检索、AI出游、AI导航、AI陪伴等方面,为用户提供贴心的出行服务。未来,车企需要的必然是以开放架构为基础,以生态聚合为核心的通用智能化解决方案。 百度地图智舱业务此次发布的方案,无疑为智能座舱语音交互的未来发展,提供了极具参考价值的方向。你认为,智能座舱在结合多模态AI技术后,还将有哪些令人期待的创新?